LLM-in-Sandbox 提出了一个简洁而有效的范式:通过给大模型提供一台虚拟电脑,让其自由探索来完成任务。实验表明,这一范式能够显著提升模型在非代码领域的表现,且无需额外训练。 研究者认为, LLM-in-Sandbox 应当成为大模型的默认部署范式 , 取代纯 LLM 推理 。当沙盒可以带来显著的性能提升,并且部署成本几乎可以忽略不计时,为什么还要用纯 LLM?
为了深度了解这门编程课,前不久糕妈还和西瓜创客创始人肖轶翔,做了一场直播对谈,发现西瓜创客的教育理念跟糕妈不谋而合。
来自中国人民大学的董冠霆,主要研究方向为智能信息检索和智能体强化学习,曾获国家奖学金、北京市优秀毕业生等荣誉,并入选国家自然科学基金青年学生基础研究项目 (博士生)、中国科协青年人才托举工程博士生专项计划资助,代表工作包括 ARPO、AUTOIF.DMT、Search-o1、Webthinker、 FlashRAG 等, 受到国内外研究者的广泛关注。其中监督微调数据配比策略 ...
梁汝波:字节2026年要“勇攀高峰” 短期内这个“高峰”就是豆包,梁汝波,字节跳动,摩尔,字节,豆包,勇攀 ...
昨天,Kimi 重磅发布了 K2.5 ,看到朋友圈和X上一水的好评,第一次感觉国产模型,也能在视觉编程这件事上,跟国际顶尖水平掰掰手腕了。 根据官方介绍,K2.5 是 Kimi 目前最全能的基座模型,最大的特点就是三个关键词:视觉、编程、Agent。
让大模型有更好的「品味」,这就不得不让人想到两个多星期前,月之暗面创始人杨植麟在 AGI-Next 前沿峰会上的演讲。他曾提到,做模型的过程本质上是在创造一种世界观,让 AI 有更好的 taste,是 Kimi 目前发展的重点。
AMD推出可选择化的Adrenalin AI 套件近日,AMD式发布 AMD Software: Adrenalin Edition 26.1.1,并同步推出 AMD Software: Adrenalin Edition AI Bundle。该 ...
最后,是不得不说的安全隐患。这玩意能干活,是建立在你把你电脑的控制权全交给一个AI的基础上的,相当于把你的账号密码、银行卡信息、聊天记录、机密文件等全交给 AI。 万一有人在网页里藏了恶意指令,让 Clawdbot ...
据TechCrunch统计,2025年年美国AI初创公司共完成64笔单笔金额超过1亿美元的融资,其中8家公司实现多轮大额加注,估值持续抬升,比如Cognition AI估值达到102亿美元,Sierra也跻身百亿美元俱乐部。
而且,这样一个 AI 智能体是主动工作的,Clawdbot 一直挂在后台,可以时刻监控你的邮件、日历。比如它可以在凌晨 3 点收到一封紧急邮件后判断重要性,然后通过 WhatsApp 给你发一条消息叫醒你(甚至真的给自己写个脚本打你电话)。
2026年1月23日,北京——摩尔线程与北京市十一学校共同宣布,双方战略合作的“AI教育实训基地”已正式启用。作为首个落地北京的AI实训示范项目,该基地部署了摩尔线程MTTAIBOOK及云端算力,为学校多元化的人工智能课 ...
阿里巴巴创始人马云近日在一场公益活动中,就人工智能(AI)对乡村教育的影响发表了看法。他指出,AI技术既是挑战,也为教育回归本质提供了契机。当前,乡村教师普遍关注AI时代下教育是否会被边缘化的问题,马云强调,教育的重点不应再是让孩子与AI比拼计算和记忆能力,而是培养他们的好奇心、想象力、创造力等核心素质。