跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(83) LLM(80) 大语言模型(64) 人工智能(54) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) ChatGPT(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) RAG(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) 智能体(6) whisper(6) Prisma(6) 隐私保护(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 模型评估(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

介绍


随着OpenAI的ChatGPT-4于2023年推出,以及Anthropic AI的Claude 3于本月早些时候推出,当前的人工智能市场正在蓬勃发展,尤其是在世代人工智能领域。这些模型减轻了内容开发人员的工作,现在城里有了一名软件工程师。

不到72小时前,Cognition发布了世界上第一位完全自主的人工智能软件工程师Devin,在SWE工作台编码基准上树立了最先进的新标准。只需一个提示,Devin就可以编写代码或创建网站,就像人类软件工程师一样。

在我们深入研究Devin之前,我们将熟悉它的创造者——认知。

什么是Cognition?


Cognition成立于2023年11月,是一家位于美国的应用人工智能实验室,专注于推理。通过利用推理,他们打算解锁人工智能的众多学科。认知目前包括与谷歌DeepMind、Cursor、Scale AI和Nuro等科技巨头合作过的专业人士和领导者。他们已经获得了2100万美元,由彼得·蒂尔的创始人基金领导。Cognition得到了DoorDash首席执行官Tony Xu和加密货币平台Coinbase创始人Fred Ehrsam等巨头的支持。

 

Devin是什么?


Devin是一个自主模型,可以在一个提示下规划、分析和执行复杂的代码和软件工程任务。它有自己的命令行、代码编辑器和单独的web浏览器。

通过在几个不同的API提供商上测试Meta的Llama 2,展示了该模型的功能。在解决问题之前,Devin首先制定了一个循序渐进的“计划”。然后,它继续使用与人类软件工程师相同的工具构建整个项目。使用内置浏览器,Devin能够调出API文档,阅读并学习如何插件到这些API中的每一个。最后,它构建并部署了一个样式齐全的网站。

Devin的与众不同之处在于它从错误中学习的能力。它可以做出成千上万的决定,并随着时间的推移变得更好。

当它在一些标准的软件工程问题集上进行测试时,它的性能优于其他解决方案。

Devin还就人工智能任务接受了顶级科技品牌的采访,并达到了预期。它还完成了Upwork上发布的真实工作中的任务,如编码任务、调试计算机视觉模型和生成详细报告。

Devin在GitHub Copilot(一种代码完成工具)上有一个一瞥。程序员可以将提示转换为可运行的代码。这种人工智能编码器不仅可以完成代码块,还可以跨多种语言进行翻译。相当令人印象深刻,对吧?但Devin能够在没有人为干预的情况下从头开始完成代码,这让它更上一层楼。

Devin是如何工作的?


如前所述,Devin有自己的命令行、自己的代码提示器部分和自己的web浏览器来收集资源。
当输入提示时,Devin将进入“计划器”模式,在该模式中,一个循序渐进的指南将解释如何解决问题。

完成此操作后,仪表板将移动到四部分界面

  • 一个具有所有输入提示的
  • 第二个是命令行部分
  • 第三,它自己的代码编辑器和
  • 第四,它有自己的浏览器,可以对资源进行全面分析,从而得出推论。
  • 最后给出了解决方案的可视化。


如何访问Devin?


Devin可以提前访问,您可以通过加入候补名单来使用或“雇佣”Devin。

Devin与其他模型相比如何?


Devin已经在SWE平台上进行了测试,SWE平台是一个基准测试平台,任务代理解决开源项目中的现实问题,最常用于软件工程师。根据Cognition的说法,Devin是在数据集的随机25%的子集上进行评估的。所有模型都得到了帮助,即模型被告知需要编辑的确切文件,而Devin则没有得到帮助。Devin端到端正确解决了13.86%的问题,这与Claude 2的4.8%和ChatGPT-4的1.74%相比有了巨大的飞跃。Cognition表示,他们将很快发布更详细的技术报告!

Devin会取代软件工程师吗?


从基准测试中可以看出,这些令人印象深刻的数字在人们,尤其是软件开发人员和工程师的心目中引起了混乱,他们对软件工作和相关工作的未来感到不安。

Cognition是一家专注于推理的应用人工智能实验室,声称正在培养具有超越现有人工智能工具能力的人工智能队友。

Cognition表示,“Devin是一个不知疲倦、技术娴熟的队友,同样愿意与你一起建设或独立完成任务供你审查。有了Devin,工程师可以专注于更有趣的问题,工程团队可以努力实现更宏伟的目标”。

有趣的是,正如大多数人认为Devin是许多软件工程师的终点一样,Devin的制造商Cognition正在积极雇佣“人类”软件工程师!各方意见不一,在对Devin进行全面测试之前,我们无法得出任何结论。

正如特斯拉前人工智能总监Andrej Karpathy所说,“在我看来,自动化软件工程将类似于自动化驾驶。”他接着说,软件工程正在发生重大变化。它将涉及更多的监督自动化,同时用英语提出高级命令、想法或进展策略。

就像任何其他生成人工智能工具一样,Devin只能和使用它的人一样好!这些只是高效用户手中的工具,使他/她的任务不那么繁琐和耗时!

 

结论


Devin AI是Generative AI领域的一大步,通过自动化编码任务和复杂问题,彻底改变了软件开发领域。随着GPT-4、Claude 3和现在Devin等模型的问世,Generative AI的未来似乎充满希望;他们不是来取代我们的,而是来帮助我们的。下一期再见!