个人空间 - 便宜云服务器 - 中文开源技术交流社区

Baihai_IDP

Baihai IDP：AI训推云平台。一站式提供多样的算力资源、MLOPs/LMOPs工具、MaaS服务。

认证官方账号

4.7K

经验值

4.7K

开源豆

关注私信

AI 集成开发环境

2

连击天

fork: star:

加载中

近期，我们正式推出了IDP LM ——专属大模型构建应用加速平台，IDP LM 将带您踏上自有可控AI大模型构建和应用的新篇章。 01 IDP LM是什么 IDP LM旨在为企业提供高效易用的大模型微调工具和服...

alex 性能优化数据处理 idplm baihaiai 01idplm rlhf comidplm 02idplm 03idplm

2023/05/16 16:45

294

编者按：我们今天为大家带来的这篇文章，作者的观点是文本嵌入向量并非我们想象中的安全载体，在某些条件下，通过适当的技术手段可以高精度地还原出原始文本内容。作者在本文介绍了其开发的...

文本嵌入向量数据库检索增强生成嵌入向量 vec2text方法信息反演

前天 10:42

3.5K

编者按：当你收到一篇由 AI 完成的文章时，是否也有过这样的困惑：内容看似专业严谨，读起来却总觉得缺少什么？明明语法正确、逻辑清晰，为什么就是无法抓住读者的注意力？本文作者基于丰富...

向量数据库 https 大语言模型文档数据库 blog llms retrievalgrounding

07/02 08:46

111

编者按：我们今天为大家带来的文章，作者的观点是：真正的 AI 护城河需要系统性地构建六层递进式能力，从技术底座到战略壁垒，缺一不可。文章提出了“AI Moat Pyramid”框架，详细阐述了六...

AI护城河定制化模型专有数据工作流集成领域专精网络效应战略护城河

06/27 10:30

1K

编者按： AI 编程工具如何迅速检索海量代码库，并精准定位到最相关的代码片段？这个看似不可能完成的任务，却是决定现代 AI 编程工具用户体验的关键技术挑战。我们今天为大家带来的这篇文章...

默克尔树代码索引嵌入向量语义搜索数据完整性隐私保护

06/26 11:28

5.6K

编者按：人工智能真的已经深入我们的日常生活了吗？当我们还在讨论 AI 技术的潜力时，是否忽略了一个更为重要的事实 —— AI 的实际使用量可能远超我们的想象？以 Google 为例，其 AI 交互...

AI交互处理 token数量代码智能体多模态交互推理API Gemini模型

06/20 11:18

2.7K

编者按：我们今天为大家带来的这篇文章，作者的观点是：只有深入理解 AI 编程工具的底层原理和能力边界，才能真正驾驭这些工具，让它们成为提升开发效率的“外挂神器”。本文从 LLM 的基础...

AI编程工具智能提示词工具调用代码库索引语义功能代码变更标记规则

06/18 10:31

1.5W

编者按： AI 智能体到底应该如何构建？是追求复杂的端到端解决方案，还是回归软件工程的本质思维？我们今天为大家带来的文章，作者的观点是：智能体本质上就是软件，应该用严谨的软件工程原...

软件工程原则 AI智能体 DAG编排工具机器学习模型确定性软件状态转移规则

06/16 07:59

8.9K

编者按：当身边的人都在谈论 AI Agent 时，你是否会困惑：究竟什么才是真正的智能体？为什么 OpenAI、IBM 和各大技术领袖给出的智能体定义都不相同？我们今天为大家带来的这篇文章，作者的...

智能体元年大语言模型自主性环境交互目标导向多智能体系统

05/30 10:38

5K

编者按：如何将 LLM 的推理过程从"烧钱的无底洞"转变为"高性能的生产力引擎"？本文深入剖析了提升 LLM 推理效率的五大核心技术：巧妙的 KV 缓存管理、Query-sparsity attention（QUEST）、推...

KV缓存管理 Query-sparsityattention 推测解码权重调度系统级优化

05/28 11:41

7K

编者按：本文首先解析了为什么 LLM 训练需要强化学习，详细讲解了 RL 和 RLHF 的工作原理；继而系统比较基于价值、基于策略和 Actor-Critic 三大强化学习范式的优缺点；最后深入剖析 TRPO 和...

强化学习大语言模型人类反馈 TRPO PPO GRPO

05/27 10:58

5.5K

编者按：近日，Qwen 3 技术报告正式发布，该系列也采用了从大参数模型中蒸馏知识来训练小参数模型的技术路线。那么，模型蒸馏技术究竟是怎么一回事呢？今天给大家分享的这篇文章深入浅出地...

模型蒸馏知识蒸馏教师模型学生模型软标签 KL散度

05/21 08:51

1W

编者按：如何有效利用大语言模型（LLMs）生成高质量代码？这是当下开发者们比较关心的一个问题。在生成代码的过程中，提示词的设计是否精确，直接决定了模型输出的质量。本文深入探讨了提示...

代码生成提示词优化大语言模型上下文深度架构模式性能要求代码审查

05/19 10:06

1W

编者按：模型上下文协议（MCP）究竟安全可靠吗？当你通过 MCP 插件让 AI Agent 访问公司文档、员工聊天记录或客户信息时，你真的了解潜在的安全风险吗？文章详细剖析了 MCP 存在的四大问题...

MCP安全风险协议认证不足恶意代码执行数据泄露风险工具风险分级

05/14 10:35

8.8K

编者按：我们今天为大家带来的这篇文章，作者的观点是：即便在大语言模型上下文窗口不断扩大的今天，检索增强生成（RAG）技术依然具有不可替代的价值。文章首先通过 Fiction.liveBench 基准...

05/12 10:19

9.2K

编者按： Google 新推出的 A2A 与 Anthropic 的 MCP 到底有何区别？它们是竞争关系还是互补的技术？本文通过一个规划夏威夷旅行的生动案例，清晰拆解了这两大协议的本质区别：MCP 更像是为单...

AI协作 A2A协议 MCP协议智能体网络任务分解专家团队

04/30 10:00

365

编者按：当前 AI 基础模型的商业前景正面临前所未有的挑战。开源模型的性能日益接近甚至在某些领域超越闭源产品，高昂的推理成本让订阅制模式的盈利空间被严重挤压，而价格战使 API 服务利润...

AI芯片生态闭环垂直整合 VIP产品 API服务垄断格局

04/25 12:12

6K

编者按：这篇技术解析详细阐述了 DeepSeek-V3-Base 的预训练阶段所采用的关键技术。文章重点介绍了三项核心技术：Document Packing 技术有效解决了输入序列长度差异导致的资源浪费问题；F...

DocumentPacking Fill-in-the-Middle 长上下文窗口扩展预训练数据构建训练策略

04/21 11:29

7.7K

编者按：当你面对需要高质量逆向推理能力的应用场景时，传统大语言模型是否让你感到力不从心？在诗歌逆向补全、逻辑逆向推导等任务中，为什么即使是 GPT-4o 这样的强大模型也会表现失常？ ...

逆向推理扩散模型 LLaDA 自回归模型诗歌补全性能对比

04/17 11:15

5.6K

没有更多内容

加载失败，请刷新页面

?便宜云服务器(OSChina.NET)

工信部

开源软件推进联盟

指定官方社区

社区规范

北京奥思研工智能科技有限公司版权所有

京ICP备2025119063号

顶部