In Python - 搜索 News

CUDA要凉？Claude 30分钟铲平英伟达护城河，AMD要笑醒了

令人惊叹的是，johnnytshi在短短30分钟内，就把整个CUDA后端移植到了AMD ROCm上，而且中间没用任何翻译层。另外一个好处当然是，不用费劲去搭像Hipify这种复杂的翻译环境了；直接在命令行（CLI）里就能干活。

3 小时

PolarDB，如何率先赢得通往 AI 时代的半张门票？

一半攥在大模型手里，以一周一迭代、一月一颠覆的速度卷出了新高度：LMArena.ai 数据显示，自 2023 年年中起，SOTA（当前最优模型）的迭代周期被压缩至 35 天，短短 5 个月就可能跌出 Top5，7 个月后连 Top10 的门槛都摸不到。

InfoQ中国 on MSN

Agent Skills 落地实战：拒绝“裸奔”，构建确定性与灵活性共存的混合 ...

摘要随着 Anthropic 开源 skills 仓库，"Code Interpreter"（代码解释器）模式成为 Agent 开发的热门方向。许多开发者试图采取激进路线：赋予 LLM 联网和 Python 执行权限，让其现场编写代码来解决一切问题 ...

InfoQ中国 on MSN

Django发布6.0版本，提供内置的后台任务和原生CSP支持

Django是广受欢迎的Python Web框架，最近发布了Django 6.0版本，带来了专注于开发者需求的新特性、安全增强以及性能改进，旨在现代化Web应用开发。 Django 6.0引入了几项重要特性，包括内置的后台任务框架、原生的内容安全策略 ...

腾讯网

用提示工程让大模型自己检查自己：CoVe方法有效减少幻觉

LLM幻觉问题至今没有根治方案。RAG能缓解一部分，但成本高、架构复杂，而且只适用于有外部知识源的场景。而对于模型"应该知道但经常搞错"的那类问题，比如历史事件的时间线、人物履历的细节，RAG帮不上什么忙。Chain-of-Verification（ ...

7 天

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

回头来看，美团大模型站到台前时间并不算长但节奏清晰，首次亮相在 2025 年 9 月，此后保持了每月一更的开源节奏，不断扩容自己的能力库：从强调响应速度的 LongCat-Flash-Chat 到专注逻辑的 Thinking ...

10 天

Suzy Menkes：伦敦时装周第一天

伦敦时装周的开场完全出乎意料—— 既非某位英国艺术学院的新晋设计师之作，也非伦敦的“特立独行”开秀。一排金属制折梯以及一堆来自中国的废旧纸板箱让我多少有点领悟了其中的真谛。

腾讯网

构建自己的AI编程助手：基于RAG的上下文感知实现方案

点击上方“Deephub Imba”,关注公众号,好文章不错过 !很多人觉得做个AI助手就是调调OpenAI的接口，其实这样智能做出一个通用聊天机器人。而代码助手需要专门为代码设计的上下文感知的RAG（Retrieval-Augmented ...

GitHub

WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)

「硬地骇客 - 两个月 $12000 ARR 实践之路」是由硬地骇客团队编著，本书是关于 Podwise 产品历程的忠实记录：内容包含灵感 - 构建 - 发布 - 增长 - 复盘五个章节。如果你觉得一个人读不够过瘾，欢迎加入「硬地骇客」官方知识星球与专家们一起讨论！Podwise 的 ...

知乎 on MSN

不用 LangGraph / AutoGPT，纯 Python 手搓 AI Agent，真的可行吗?

在真实工程项目中，不使用 LangChain、LangGraph、CrewAI 等框架，纯用 Python + LLM API 手动实现 AI Agent 不仅完全可行，而且在许多场景下是更优选择。 Anthropic 官方明确建议开发者”从直接使用 LLM API 开始” (当然，各有各的立场)，而非框架。Octomind ...

IT之家

黄仁勋：AI 是史上最伟大的技术均衡器，未来 5 年创造百万富翁数量 ...

IT之家7 月 30 日消息，在 Chamath Palihapitiya 主持的 All-In 播客节目中，英伟达首席执行官黄仁勋表示人工智能是“史上最伟大的技术均衡器”，并预测在未来 5 年内，AI 领域创造的百万富翁，要多于互联网 20 年创造的。黄仁勋表示，在人工智能时代，每个人都是 ...

IT之家

DeepSeek 代码库开源进度 1/5：为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA

IT之家2 月 24 日消息，DeepSeek 今日启动“开源周”，首个开源的代码库为 FlashMLA—— 针对 Hopper GPU 优化的高效 MLA 解码内核，专为处理可变长度序列而设计。据介绍，FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。使用 CUDA 12.6，H800 SXM5 在内存受限配置下可达 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果