令人惊叹的是,johnnytshi在短短30分钟内,就把整个CUDA后端移植到了AMD ROCm上,而且中间没用任何翻译层。 另外一个好处当然是,不用费劲去搭像Hipify这种复杂的翻译环境了;直接在命令行(CLI)里就能干活。
一半攥在大模型手里,以一周一迭代、一月一颠覆的速度卷出了新高度:LMArena.ai 数据显示,自 2023 年年中起,SOTA(当前最优模型)的迭代周期被压缩至 35 天,短短 5 个月就可能跌出 Top5,7 个月后连 Top10 的门槛都摸不到。
InfoQ中国 on MSN
Agent Skills 落地实战:拒绝“裸奔”,构建确定性与灵活性共存的混合 ...
摘要 随着 Anthropic 开源 skills 仓库,"Code Interpreter"(代码解释器)模式成为 Agent 开发的热门方向。许多开发者试图采取激进路线:赋予 LLM 联网和 Python 执行权限,让其现场编写代码来解决一切问题 ...
InfoQ中国 on MSN
Django发布6.0版本,提供内置的后台任务和原生CSP支持
Django是广受欢迎的Python Web框架,最近发布了Django 6.0版本,带来了专注于开发者需求的新特性、安全增强以及性能改进,旨在现代化Web应用开发。 Django 6.0引入了几项重要特性,包括内置的后台任务框架、原生的内容安全策略 ...
LLM幻觉问题至今没有根治方案。RAG能缓解一部分,但成本高、架构复杂,而且只适用于有外部知识源的场景。而对于模型"应该知道但经常搞错"的那类问题,比如历史事件的时间线、人物履历的细节,RAG帮不上什么忙。Chain-of-Verification( ...
回头来看,美团大模型站到台前时间并不算长但节奏清晰,首次亮相在 2025 年 9 月,此后保持了每月一更的开源节奏,不断扩容自己的能力库:从强调响应速度的 LongCat-Flash-Chat 到专注逻辑的 Thinking ...
伦敦时装周的开场完全出乎意料—— 既非某位英国艺术学院的新晋设计师之作,也非伦敦的“特立独行”开秀。一排金属制折梯以及一堆来自中国的废旧纸板箱让我多少有点领悟了其中的真谛。
点击上方“Deephub Imba”,关注公众号,好文章不错过 !很多人觉得做个AI助手就是调调OpenAI的接口,其实这样智能做出一个通用聊天机器人。而代码助手需要专门为代码设计的上下文感知的RAG(Retrieval-Augmented ...
「硬地骇客 - 两个月 $12000 ARR 实践之路」是由 硬地骇客 团队编著,本书是关于 Podwise 产品历程的忠实记录:内容包含 灵感 - 构建 - 发布 - 增长 - 复盘 五个章节。如果你觉得一个人读不够过瘾,欢迎加入「硬地骇客」官方知识星球与专家们一起讨论!Podwise 的 ...
在真实工程项目中,不使用 LangChain、LangGraph、CrewAI 等框架,纯用 Python + LLM API 手动实现 AI Agent 不仅完全可行,而且在许多场景下是更优选择。 Anthropic 官方明确建议开发者”从直接使用 LLM API 开始” (当然,各有各的立场),而非框架。Octomind ...
IT之家7 月 30 日消息,在 Chamath Palihapitiya 主持的 All-In 播客节目中,英伟达首席执行官黄仁勋表示人工智能是“史上最伟大的技术均衡器”,并预测在未来 5 年内,AI 领域创造的百万富翁,要多于互联网 20 年创造的。 黄仁勋表示,在人工智能时代,每个人都是 ...
IT之家2 月 24 日消息,DeepSeek 今日启动“开源周”,首个开源的代码库为 FlashMLA—— 针对 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列而设计。据介绍,FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。 使用 CUDA 12.6,H800 SXM5 在内存受限配置下可达 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈