加载中
IDP LM - 助力企业快速构建专属大模型

近期,我们正式推出了IDP LM ——专属大模型构建应用加速平台,IDP LM 将带您踏上自有可控AI大模型构建和应用的新篇章。 01 IDP LM是什么 IDP LM旨在为企业提供高效易用的大模型微调工具和服...

vec2text 技术已开源!一定条件下,文本嵌入向量可“近乎完美地”还原

编者按: 我们今天为大家带来的这篇文章,作者的观点是文本嵌入向量并非我们想象中的安全载体,在某些条件下,通过适当的技术手段可以高精度地还原出原始文本内容。 作者在本文介绍了其开发的...

我对 AI 写作的一些思考:Writing in the Age of LLMs

编者按: 当你收到一篇由 AI 完成的文章时,是否也有过这样的困惑:内容看似专业严谨,读起来却总觉得缺少什么?明明语法正确、逻辑清晰,为什么就是无法抓住读者的注意力? 本文作者基于丰富...

The AI Moat Pyramid:构建不可复制的 AI 护城河

编者按: 我们今天为大家带来的文章,作者的观点是:真正的 AI 护城河需要系统性地构建六层递进式能力,从技术底座到战略壁垒,缺一不可。 文章提出了“AI Moat Pyramid”框架,详细阐述了六...

Cursor 如何保障「代码索引」的安全、高效

编者按: AI 编程工具如何迅速检索海量代码库,并精准定位到最相关的代码片段?这个看似不可能完成的任务,却是决定现代 AI 编程工具用户体验的关键技术挑战。 我们今天为大家带来的这篇文章...

为什么说大家低估了 AI 的实际使用规模?实际情况如何?

编者按: 人工智能真的已经深入我们的日常生活了吗?当我们还在讨论 AI 技术的潜力时,是否忽略了一个更为重要的事实 —— AI 的实际使用量可能远超我们的想象? 以 Google 为例,其 AI 交互...

深度解析 Cursor(逐行解析系统提示词、分享高效制定 Cursor Rules 的技巧...)

编者按: 我们今天为大家带来的这篇文章,作者的观点是:只有深入理解 AI 编程工具的底层原理和能力边界,才能真正驾驭这些工具,让它们成为提升开发效率的“外挂神器”。 本文从 LLM 的基础...

AI 智能体到底应该如何构建?分享 Github 上收获 4k stars 的 12 条原则

编者按: AI 智能体到底应该如何构建?是追求复杂的端到端解决方案,还是回归软件工程的本质思维? 我们今天为大家带来的文章,作者的观点是:智能体本质上就是软件,应该用严谨的软件工程原...

对 AI Agent 定义的一些探讨

编者按: 当身边的人都在谈论 AI Agent 时,你是否会困惑:究竟什么才是真正的智能体?为什么 OpenAI、IBM 和各大技术领袖给出的智能体定义都不相同? 我们今天为大家带来的这篇文章,作者的...

大语言模型推理优化技术综述(The Art of LLM Inference)

编者按: 如何将 LLM 的推理过程从"烧钱的无底洞"转变为"高性能的生产力引擎"?本文深入剖析了提升 LLM 推理效率的五大核心技术:巧妙的 KV 缓存管理、Query-sparsity attention(QUEST)、推...

「DeepSeek 技术解析」:LLM 训练中的强化学习算法

编者按: 本文首先解析了为什么 LLM 训练需要强化学习,详细讲解了 RL 和 RLHF 的工作原理;继而系统比较基于价值、基于策略和 Actor-Critic 三大强化学习范式的优缺点;最后深入剖析 TRPO 和...

模型蒸馏:“学神”老师教出“学霸”学生

编者按: 近日,Qwen 3 技术报告正式发布,该系列也采用了从大参数模型中蒸馏知识来训练小参数模型的技术路线。那么,模型蒸馏技术究竟是怎么一回事呢? 今天给大家分享的这篇文章深入浅出地...

如何用好“对话式编程”?牢记这十二条策略

编者按: 如何有效利用大语言模型(LLMs)生成高质量代码?这是当下开发者们比较关心的一个问题。在生成代码的过程中,提示词的设计是否精确,直接决定了模型输出的质量。 本文深入探讨了提示...

MCP 协议为何不如你想象的安全?从技术专家视角解读

编者按: 模型上下文协议(MCP)究竟安全可靠吗?当你通过 MCP 插件让 AI Agent 访问公司文档、员工聊天记录或客户信息时,你真的了解潜在的安全风险吗? 文章详细剖析了 MCP 存在的四大问题...

驳“RAG 已死”论:上下文窗口扩展≠RAG 终结

编者按: 我们今天为大家带来的这篇文章,作者的观点是:即便在大语言模型上下文窗口不断扩大的今天,检索增强生成(RAG)技术依然具有不可替代的价值。 文章首先通过 Fiction.liveBench 基准...

05/12 10:19
9.2K
Google 新推出的 A2A 与 Anthropic 的 MCP 到底有何区别?

编者按: Google 新推出的 A2A 与 Anthropic 的 MCP 到底有何区别?它们是竞争关系还是互补的技术? 本文通过一个规划夏威夷旅行的生动案例,清晰拆解了这两大协议的本质区别:MCP 更像是为单...

面对开源大模型浪潮,基础模型公司如何持续盈利?

编者按: 当前 AI 基础模型的商业前景正面临前所未有的挑战。开源模型的性能日益接近甚至在某些领域超越闭源产品,高昂的推理成本让订阅制模式的盈利空间被严重挤压,而价格战使 API 服务利润...

「DeepSeek-V3 技术解析」:DeepSeek-V3-Base 预训练阶段解析

编者按: 这篇技术解析详细阐述了 DeepSeek-V3-Base 的预训练阶段所采用的关键技术。 文章重点介绍了三项核心技术:Document Packing 技术有效解决了输入序列长度差异导致的资源浪费问题;F...

能否将扩散模型思想应用于 LLMs 领域?大型语言扩散模型(LLDM)详解

编者按: 当你面对需要高质量逆向推理能力的应用场景时,传统大语言模型是否让你感到力不从心?在诗歌逆向补全、逻辑逆向推导等任务中,为什么即使是 GPT-4o 这样的强大模型也会表现失常? ...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部
http://www.vxiaotou.com