月之暗面近日发布Kimi K2.6版本,这款被视为杨植麟团队首个X.6里程碑的产品,在工程能力上实现跨越式突破。该版本不仅支持单个任务持续12小时、完成4000次工具调用,更在Agent Swarm场景中实现300个子agent协同、4000个协调步骤的复杂操作,标志着AI从"对话工具"向"生产力平台"的转型。
AI 快用不起了。大模型机构密集发出“涨价信号”。 在国内,智谱 4 月 8 日随 GLM-5.1 新模型发布同时宣布涨价 10% ——这是它 2026 年内第三次涨价,CEO 张鹏的解释很直白:“公司存在算力约束和瓶颈。”一周后,大洋彼岸的 Anthropic 出手: Claude 企业版原本 $200 /人/月的包月套餐,改成 $20 座位费+按实际算力消耗另行计费,重度 Claude Cod ...
浙江翼菲智能科技股份有限公司(简称:“翼菲智能”)日前通过上市聆讯,准备在港交所上市。
人工智能领域迎来重要进展,旗舰模型K2.6正式发布并开源,在代码生成、长程任务处理和智能体协作方面展现出显著优势。该模型在多项权威测试中表现突出,在博士级难度的"人类最后的考试"中以54.0%的得分位居榜首,在深度检索能力评估中以92.5%的成绩大幅领先同类模型。 在软件工程能力验证方面,K2.6在SWE-Bench ...
今天凌晨,苹果官宣库克将卸任 CEO,由约翰·特努斯 (John Ternus) 接手。同期,两封内部信流出,一封来自现任 CEO Tim Cook,另一封来自 John Ternus。 库克在信中表示,自己将在今年内卸任 CEO ...
Kimi K2.6,专注AI编程和agent ...
随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。 然而,当用户指令本身存在权限上的歧义时,Auto Mode 是否真的能够稳定替代人工审核?香港科技大学与 ETH Zuri ...
面对市场上琳琅满目的机构,家长们往往感到无从下手。本文旨在基于2026年4月的市场调研与行业洞察,为您客观分析并推荐五家在上海地区颇具口碑与实力的儿童编程培训机构,并提供一份实用的采购指南。
AI评测领域近日掀起轩然大波,多个主流基准测试的可靠性遭到严重质疑。伯克利大学研究团队通过开发自动化漏洞扫描工具,成功攻破八大权威评测体系,其中SWE-bench编程基准更被10行Python代码轻松破解,500道测试题全部获得满分却未修复任何真实漏洞。 该团队揭示的作弊手段令人震惊:在SWE-bench测试中,研究人员通过提交包含conftest.py文件的代码包,利用pytest框架的钩子机制 ...
在山东潍坊安丘市公安局侦查中心,两名青年民警正对着电脑屏幕调试自主研发的警务小工具。屏幕上,百万级电子数据快速转化为清晰可视的交互界面,原本需要数天的数据研判工作,如今仅需几分钟就能完成。
智通财经APP获悉,试图进军芯片代工领域挑战“芯片代工之王” 台积电 近乎垄断份额的美国老牌芯片巨头 英特尔 (INTC.US) ,已聘请 三星电子 公司资深高管Shawn ...
京公网安备 11010802000104号京ICP备09113703号-1信息网络传播视听节目许可证: 0110553广播电视节目制作经营许可证公司名称:北京车之家信息技术有限公司中央网信办违法和不良信息举报中心违法和不良信息举报电话:400-868-5856 举报邮箱:jubao@autohome.com.cn ...