跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(82) LLM(75) 大语言模型(63) 人工智能(53) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(33) Go基础(29) Python(24) Vue(22) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) ChatGPT(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) whisper(6) Prisma(6) 隐私保护(6) RAG(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) 智能体(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) kafka(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) nextjs(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 大型语言模型(2) 语言模型(2) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

我们很高兴介绍Phi-3,这是一个由微软开发的开放式人工智能模型家族。Phi-3模型是可用的功能最强大、成本效益最高的小型语言模型(SLM),在各种语言、推理、编码和数学基准测试中都优于相同大小和下一大小的模型。此版本为客户扩展了高质量模型的选择范围,在他们编写和构建生成型人工智能应用程序时提供了更实用的选择。

从今天开始,Phi-3-mini,一种3.8B语言模型,可在Microsoft Azure AI Studio、Hugging Face和Ollama上使用。

  • Phi-3-mini有两种上下文长度变体——4K和128K代币。它是同类中第一个支持高达128K令牌的上下文窗口的模型,对质量几乎没有影响。
  • 它是经过指令调整的,这意味着它被训练来遵循反映人们正常沟通方式的不同类型的指令。这样可以确保模型可以开箱即用。
  • 它可以在Azure AI上使用,以利用部署评估微调工具链,也可以在Ollama上使用,供开发人员在笔记本电脑上本地运行。
  • 它已针对ONNX Runtime进行了优化,支持Windows DirectML,并支持图形处理单元(GPU)、CPU甚至移动硬件的跨平台支持。
  • 它还可以作为NVIDIA NIM微服务提供,具有可部署在任何地方的标准API接口。并针对NVIDIA GPU进行了优化。
  • 在未来几周,Phi-3系列将增加更多型号,为客户提供更大的质量成本曲线灵活性。Phi-3-小型(7B)和Phi-3-中型(14B)不久将在Azure AI模型目录和其他模型花园中提供。   

微软继续在质量成本曲线上提供最好的型号,今天的Phi-3版本通过最先进的小型型号扩大了型号的选择范围。

小尺寸的突破性性能


在关键基准测试中,Phi-3模型显著优于相同大小和更大大小的语言模型(请参阅下面的基准测试数字,越高越好)。Phi-3-mini比其两倍大的型号做得更好,Phi-3-small和Phi-3-medium的表现要好得多,包括GPT-3.5T。
所有报告的数字都是用相同的管道生成的,以确保数字具有可比性。因此,由于评估方法略有不同,这些数字可能与其他公布的数字不同。我们的技术文件提供了有关基准的更多详细信息。
注:Phi-3模型在事实知识基准(如TriviaQA)上表现不佳,因为模型尺寸越小,保留事实的能力越低。

安全第一模式设计


Phi-3模型是根据微软负责任人工智能标准开发的,这是一套基于以下六个原则的全公司要求:问责制、透明度、公平性、可靠性和安全性、隐私性和安全性以及包容性。Phi-3型号经过了严格的安全测量和评估、红队、敏感使用审查以及遵守安全指南,以帮助确保这些型号按照微软的标准和最佳实践进行负责任的开发、测试和部署。

在我们之前使用Phi模型(“课本就是你所需要的一切”)的基础上,Phi-3模型也使用高质量的数据进行训练。通过广泛的安全岗位培训,包括从人类反馈中强化学习(RLHF)、数十种伤害类别的自动测试和评估,以及手动红队,它们得到了进一步改进。我们的技术文件中详细介绍了我们的安全培训和评估方法,并在模型卡中概述了推荐用途和限制。请参阅模型卡集合。

解锁新功能


微软运送副驾驶的经验,以及使客户能够使用Azure人工智能通过生成人工智能转变业务的经验,凸显了在不同任务的质量成本曲线上对不同尺寸模型的日益增长的需求。像Phi-3这样的小型语言模型尤其适用于:

  • 资源受限的环境,包括设备上和离线推理场景。
  • 有延迟限制的场景,其中快速响应时间至关重要。
  • 成本受限的用例,尤其是那些任务更简单的用例。


有关小型语言模型的更多信息,请参阅我们的Microsoft源代码博客。

由于其较小的尺寸,Phi-3模型可以用于计算有限的推理环境。特别是Phi-3-mini,可以在设备上使用,尤其是当使用ONNX Runtime进行进一步优化以实现跨平台可用性时。Phi-3型号的更小尺寸也使微调或定制变得更容易、更实惠。此外,它们较低的计算需求使其成为一种成本较低、延迟更好的选择。较长的上下文窗口允许对大型文本内容(文档、网页、代码等)进行理解和推理。Phi-3-mini展示了强大的推理和逻辑能力,使其成为分析任务的良好候选者。

客户已经在使用Phi-3构建解决方案。Phi-3已经证明其价值的一个例子是在农业领域,那里的互联网可能不容易访问。强大的小型模型,如Phi-3和微软副驾驶模板,可在需要时提供给农民,并提供以更低成本运行的额外好处,使人工智能技术更容易获得。

总部位于印度的领先企业集团ITC正在利用Phi-3作为他们与微软继续合作的一部分,为Krishi Mitra开发副驾驶,这是一款面向农民的应用程序,覆盖了100多万农民。

“我们使用Krishi Mitra副驾驶的目标是提高效率,同时保持大型语言模型的准确性。我们很高兴能与微软合作,使用经过微调的Phi-3版本来实现我们的目标——效率和准确性!”

Saif Naik,ITCMARS技术主管


Phi模型起源于Microsoft Research,已被广泛使用,Phi-2下载次数超过200万次。Phi系列模型在战略数据管理和创新方面取得了显著成绩 缩放比例。从用于Python编码的模型Phi-1开始,到增强推理和理解的Phi-1.5,再到27亿参数模型Phi-2,在语言理解方面的表现超过了其25倍。1每次迭代都利用了高质量的训练数据和知识转移技术 挑战传统 缩放定律。

立即开始


要亲自体验Phi-3,请先在Azure AI游乐场上玩该模型。你也可以在拥抱聊天的操场上找到这个模型。使用 Azure AI工作室。加入我们,在特别活动中了解更多关于Phi-3的信息 AI秀的直播。