【技术趋势】oreilly值得关注雷达趋势：2025年2月

SEO Title

Radar Trends to Watch: February 2025

上个月，DeepSeek发布了其R1推理模型（现在显然改名为DeepThink），其功能类似于OpenAI的o1。DeepSeek的重要性不在于其基准测试结果；因为有很多模型的表现与o1相当。真正重要的是，它似乎只用了可比模型十分之一的资源进行训练。把更多硬件投入问题中，通常不是获得良好结果的最佳方式。

人工智能

Anthropic为Claude添加了一个引用API。Citations将RAG直接集成到模型中。它允许用户将文档添加到上下文中。在生成回答时，Claude会包含引用，准确显示文档中哪些部分用于生成该回答。
OpenAI发布了其新竞争对手Operator的研究预览，Operator是对Anthropic的Computer Use的竞争者。与Computer Use一样，Operator是一个通用代理：它可以使用浏览器浏览网页，获取信息，并生成新的动作以完成用户的请求。
伯克利发布了Sky-T1-32B-Preview，一个小型推理模型，训练成本不到450美元。它基于阿里巴巴的Qwen2.5-32B-Instruct。Sky的表现类似于OpenAI的o1-preview，并且完全开放：训练数据、权重、代码和基础设施都是开源的。
DeepSeek发布了其R1推理模型，该模型是其V3模型的基础。R1的表现等同或优于OpenAI o1，且显著便宜。DeepSeek还发布了多个衍生自R1的其他模型，包括基于Llama和阿里巴巴Qwen的小型模型。这些模型都开源了代码和权重。
有效使用OpenAI o1的关键是上下文，而不是巧妙的提示。“不要写提示，写简报”；提供它解决问题所需的所有信息。
OpenAI宣布了一种新技术，用于训练其新推理模型以确保安全性。深思熟虑对齐训练模型自我推理安全政策，而不是要求人工评定模型的响应。
Meta推出了SeamlessM4T，一个多模态（语音和文本）模型，专为翻译而设计。它可以将近100种输入语言和35种输出语言之间的语音到语音、文本到语音进行翻译。
Anthropic获得了ISO 42001认证，该认证涵盖负责任的人工智能，并涉及AI设计和部署流程、透明度、测试和监控以及监督。
Google发布了一篇关于新LLM架构Titans（即Transformers 2.0）的论文。Titans的主要优势在于其能够扩展到非常大的上下文窗口。实际上，它为Transformers模型增加了持久的长期记忆。
ChatGPT现在可以安排定期任务，使其更像一个个人助理。任务可以包括生成提醒、安排日程、总结新闻和其他杂务。
AI系统可能会使用一种类似奥卡姆剃刀的变体进行“思考”，优先选择更简单的解决方案。
Mistral发布了Codestral 25.01，这是一个针对代码生成优化的语言模型，声称精通80多种编程语言。这个新版本更快，支持更大的上下文窗口，并且在基准测试中比同等大小的模型表现更好。
哈佛的机构数据计划已经汇集了一个大型数据集，包含数字化的免版权作品，用于训练语言模型。该数据集目前包含大约100万本书，比用于训练早期模型的Books3数据集要大得多。
微软的Phi-4模型现在可以在Hugging Face和Ollama上使用。这是另一个令人印象深刻的模型，可以在配置相对较好的笔记本电脑上运行。
4M是一个开源框架，用于训练多模态AI模型。
NVIDIA宣布了项目DIGITS，这是一个个人超级计算机，可以本地运行最多200B参数的AI模型。该系统配备128GB内存，将于5月发布，起售价为3000美元。
O2（公司名，而非GPT版本号）发布了Daisy，一个自有的语言模型。它实时接听诈骗电话，通过模仿一位脆弱的老年人，浪费骗子的时间。
Fast-LLM是一个开源库，用于训练大规模语言模型。它可以从单个GPU到大型集群进行扩展，并可以训练超过70B参数的模型。

编程

Puppet加入了前开源项目的行列，推出了自己的开源分支：OpenVox。OpenVox承诺完全兼容Puppet。该项目正在寻找赞助商。
Stratoshark是一个新的工具，用于分析Linux上的系统调用。它是Wireshark的伴侣，拥有类似的用户界面，旨在帮助用户捕获系统调用并分析其行为。
需要为地下室里的Cray X-MP编写应用程序？你将需要一个编译器。这是一个支持Linux和macOS的编译器。
Sigstore是一个项目，简化了数字签名和管理开源软件组件的过程。它减少了开发软件时建立溯源的负担，同时检查使用的依赖软件的溯源。
如果你生成更多的代码，就会有更多的代码需要调试和审查。在使用AI的团队中，三分之二的开发人员花更多时间调试和解决安全漏洞。
你真的需要一个新的终端模拟器吗？Ghostty正获得广泛好评。值得一试。
Forgejo是一个开源软件开发平台，是GitHub的自托管替代品，旨在为协作软件开发提供去中心化的平台。
一家初创公司正在构建城市的数字双胞胎。这些数字双胞胎将对城市规划者非常有用，可能还对紧急响应有所帮助。
Leptos是一个新的Rust Web框架。与另一个Rust Web框架Sycamore一样，Leptos将Rust编译为WebAssembly。
国际混淆C代码大赛（IOCCC）回来了！(你错过了吗？) 更多信息，请关注Mastodon上的@ioccc（fosstodon.org）。
一个84,688个正则表达式的国际象棋引擎：它是一件正则表达式杰作。正如作者所说，更多人应该做些完全无意义的事情。

安全

网络犯罪分子通过Roblox模块传播恶意软件。Discord、Reddit、GitHub等通讯渠道被用来引诱用户下载含有恶意软件的包。
Cloudflare成功缓解了有史以来最大的DDoS攻击：来自Mirai僵尸网络的每秒5.6太比特。一个重要的新变化是：攻击的持续时间非常短，使得人工反应变得不可能。
钓鱼攻击不总是从电子邮件开始。网络犯罪分子通过谷歌搜索广告将受害者引导到钓鱼网站，窃取他们的凭证。
FBI迫使PlugX恶意软件从4200多台计算机中自我删除。自2014年以来，PlugX一直被中国政府用来窃取受害者数据。有人怀疑下一版本的PlugX将不会再有“自我删除”命令。
一个名为Codefinger的新勒索病毒攻击加密AWS S3桶。该攻击利用AWS的服务器端加密（SSE）生成加密密钥，而这些密钥Amazon并不存储，它们仅为攻击者所知。
微软起诉了一组未公开（且不明）的开发者，因其利用合法用户账户生成有害内容。
一个错误的证书导致macOS将Docker Desktop视为恶意软件，阻止其启动。通过升级到Docker 4.37.2可以解决此问题。
一种针对加密货币交易模拟机制的攻击，欺骗受害者批准交易，从而窃取他们的钱包中的加密货币。
Cyber Trust Mark是一种认证，旨在确保消费者所使用的AI设备符合美国国家标准与技术研究院（NIST）和联邦通信委员会（FCC）设定的标准。
苹果发现，消费者面向的AI不仅存在错误问题，公司还面临通过电子邮件和聊天摘要使垃圾邮件和欺诈信息看起来合法的问题。
基于恐惧的安全产品及其销售和营销做法是适得其反的。

网络

无论TikTok的未来如何，Pixelfed——一个去中心化的照片和视频共享应用——看起来是一个不错的替代方案。与Mastodon一样，Pixelfed是联邦网络的一部分，构建于联邦协议ActivityPub之上。
Mercator: Extreme允许你将北极放置在任何你想要的地方，并绘制相应的Mercator地图。除了是一件网络杰作外，它还展示了Mercator投影的扭曲。可惜的是，几乎所有的地图仍然基于此。
Marimo playgrounds是完全在浏览器中运行的笔记本（类似于Jupyter），使用WebAssembly。它们可以轻松地保存和共享代码。
传统的网络“文化”现在仍然存在（至少在某些地方），这意味着它仍然受到严格的技术规范约束。有人在一些网络项目上开发了复古的计算机和论坛，它们保留了“80年代文化”，完全不适应现代互联网的商业化。
基于人类需要发自内心理解的现实来设计的Web：你能用直接设计来打破现有的“数字原生文化”吗？
**街道（Streets）**是OpenStreetMap的3D版本。它加载速度较慢，且许多标签并不完全是最新的，但整体表现令人印象深刻。
未来的网络是什么样的？ 如果网络要成为AI的数据来源，它将需要变得更加简化，舍弃掉大量的JavaScript和CSS，转而注重文本内容。
CAPTCHA的最新变化： 玩Doom并击杀至少三个怪物。它是通过Vercel的v0版本和提示驱动AI构建的，并且可以在浏览器中通过Wasm运行。不幸的是，我怀疑它能有效防止机器人攻击的时间会很短。

虚拟现实：
Swave是一家初创公司，正在研发全息智能眼镜，这些眼镜能够投射真正的全息影像，而不仅仅是类似全息的效果。

量子计算：

一种新的量子计算技术使得困陷离子可以在量子计算芯片上移动。这使得开发人员能够更高效地构建支持更多量子比特（qubits）的芯片。
一种新型量子冰箱使得将量子比特冷却至22毫开尔文成为可能。温度更低时，它们将不太容易受到噪声引起的错误影响。
机器人技术：
一种机器人手臂被开发出来，可以帮助钢琴家更有效地训练执行非常困难的动作。
生物学：
AI可以用来锐化被光通过组织层传递时扭曲的生物图像。过去，这个问题通常需要通过昂贵的自适应光学技术来解决。

文章链接

https://developer.chat/radar-trends-watch-february-2025

热门内容

今日:

总体:

最近浏览：

标签（标签）

【技术趋势】oreilly值得关注雷达趋势：2025年2月

category

标签

标签（标签）

Search

category

标签