下载 InfoQ App >
随时随地获取最新技术资讯
演讲人:孙志岗,艾逗笔,莫欣,何少甫
演讲人:Julia Liuson,霍太稳
演讲人:霍太稳 极客邦科技创始人&CEO;洪涛 飞书产品副总裁
策划:凌敏
本文探讨了如何利用计算统一设备架构(CUDA)将 GPU 级加速引入企业级 Java 应用,让 Java 开发人员不再局限于 CPU 核心的限制。
Vitest 是现代的原生测试运行器,它引入了 Vitest 浏览器模式,为开发人员提供了一个可替代传统 DOM 模拟库(如 JSDOM)的选择。将浏览器模式添加到 Vitest 中,允许测试在实际的浏览器环境中运行,为使用 React、Vue 或 Svelte 构建的 UI 应用程序提供了更真实、更可靠的测试行为。
Pinterest 近期发布技术博客,详解其工程团队处理亚马逊 EC2 实例网络带宽限制问题的方案。该平台月活用户超 5.5 亿,维持稳定性能对其 KVStore 机器学习特征库等核心服务尤为关键。
LMEval 用于帮助人工智能研究人员和开发人员比较不同大语言模型的性能,已经被用于评估主流大模型在安全性和可靠性方面的表现。
作为“普通工程师”的我们,在大模型、AI 加速渗透研发流程的时代,我们的角色变了吗?我们的价值还怎么被看到?本期视频和来自百度、网易游戏、同程旅行的三位嘉宾一起探讨。
Perplexity 为 Pro 用户发布了一项新功能 Labs,旨在支持问答之外的更复杂任务。这一更新标志着从基于搜索的交互向由生成式人工智能驱动的结构化、多步骤工作流程的转变。
JDAgents-R1 如何基于更小规模开源模型,达到与大规模语言模型相媲美的性能表现。
单节点的存储空间已经超过十几 TB 以上,对于处理高并发 TP 业务的 MySQL 来说,这样的压力是非常巨大的。
在 Chat BI 落地过程中,既要关注模型训练的科学性,也必须重视底层数据是否适配 AI 应用需求。
未来,极客邦科技将深化落实 AI 应用落地战略,持续优化人才培养体系与精进能力模型设计,为朝阳区数智经济发展输送高质量人才动能。
Virt8ra 是一项开创性的欧洲倡议,旨在建立一个主权的、可互操作的云生态系统,以对抗美国的云服务主导地位。随着 Virt8ra 业务的大幅扩张,现已新增 6 家供应商,并专注于开源技术,Virt8ra 促进了数据本地化和供应商独立性,为整个欧洲的创新数字未来铺平了道路。
近日,晟为数科作为应用生态融合 AI 服务的领先企业,基于 Open Harmony,全行业首发推出铠大师虚拟机鸿蒙版,在鸿蒙电脑上运行 Windows 及应用 ,满足用户畅享多元应用的需求,助力鸿蒙电脑生态发展。
传统基于数据分析师主导的流程面临效率与可扩展性瓶颈。
在这篇文章中,Holly 和 Trisha 探讨了为什么快乐并不会分散生产力,而是提升生产力的秘诀所在。
自主 Agent 有机会成为“Agent 工厂”,帮助构建和优化大规模可控、可演化的工作流 Agent。
欧盟网络安全局(ENISA)近日推出欧洲漏洞数据库(EUVD)的测试版,这一全新公共平台将与广泛使用的通用漏洞披露系统(CVE)并行运作但保持独立。该平台是为提升欧盟内部漏洞处理的协调性与透明度。
在 2025 年 Build 大会上,微软宣布计划在未来几个月内将 GitHub Copilot Chat 扩展的代码基于 MIT 许可开源,并将核心 AI 功能直接整合到 VS Code 的主代码库中。
腾讯云出海服务,助力中国企业快出海
超小端侧多模态大模型实践。
OpenAI 最近宣布将其 Codex CLI 用 Rust 重写。Codex CLI 堆栈最初支持 React、TypeScript 和 Node。重写旨在提高安全性和性能,同时改善开发人员体验。
“我们担心,Anthropic 此举不仅将损害 Windsurf,更会波及整个行业。”
ML Kit 新加入的 GenAI API 使开发者能够在 Android 应用中使用 Gemini Nano 进行本地推理,支持诸如总结、校对、改写和图像描述等功能。
复杂任务子 Agent、工具的使用,以及稳定性等问题的探索与实践。
Anthropic 发布了 Claude Opus 4 和 Sonnet 4,这是其 Claude 系列大语言模型(LLM)的最新版本。这两个模型都支持扩展思考、工具使用和记忆改进。在编码基准测试中,Claude 4 Opus 的表现超过了其他 LLM。
Manus 官方在 X 上宣布,该服务目前可供基础版、增强版及专业版订阅用户抢先体验,并计划很快向所有用户开放。
6 月 3 日,清华蚂蚁联合研发的全异步强化学习训练系统 AReaL-boba2(AReaL v0.3)正式宣布开源。
微软已经在 Azure AI Search 中推出了代理式检索(Agentic Retrieval)的公开预览版,这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法,与传统的 RAG 相比,它将会话 AI 中的答案相关性提高了 40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询,并在文本和向量嵌入中并行执行。
MCP 很重要,但也只是个协议。
小爱同学团队如何通过大模型推理框架克服资源限制,实现端侧大模型在多个业务上商业化落地。