加载中
IDP LM - 助力企业快速构建专属大模型

近期,我们正式推出了IDP LM ——专属大模型构建应用加速平台,IDP LM 将带您踏上自有可控AI大模型构建和应用的新篇章。 01 IDP LM是什么 IDP LM旨在为企业提供高效易用的大模型微调工具和服...

05/16 16:45
149
GPU深度学习性能的三驾马车:Tensor Core、内存带宽与内存层次结构

编者按:近年来,深度学习应用日益广泛,其需求也在快速增长。那么,我们该如何选择合适的 GPU 来获得最优的训练和推理性能呢? 今天,我们为大家带来的这篇文章,作者的核心观点是:Tensor ...

前天 10:06
84
语言模型文本处理基石:Tokenizer简明概述

编者按:近年来,人工智能技术飞速发展,尤其是大型语言模型的问世,让 AI 写作、聊天等能力有了质的飞跃。如何更好地理解和利用这些生成式 AI,成为许多开发者和用户关心的问题。 今天,我们...

11/29 10:24
106
企业级应用场景中,LLM 的数据特性剖析及处理对策

编者按:今年以来,大语言模型(LLM)在消费者(2C)市场崭露头角,同时也吸引了大量企业的关注。但是直接将这些面向消费者的模型引入企业环境,可能会面临一些风险。今天我们为大家带来的这篇...

11/27 10:16
73
用好语言模型:temperature、top-p等核心参数解析

编者按:我们如何才能更好地控制大模型的输出? 本文将介绍几个关键参数,帮助读者更好地理解和运用 temperature、top-p、top-k、frequency penalty 和 presence penalty 等常见参数,以优化语...

11/23 13:30
47
Embedding技术与应用(4): Embedding应用工程探析

编者按:随着互联网内容数量的急剧增长,个性化推荐已成为各大科技公司的核心竞争力之一。那么,如何构建一个可靠、高效的基于嵌入技术的推荐系统,使其能够在实际生产环境中正常运行呢?这是...

11/20 10:15
61
轻松理解 Transformers (4) :Decoder 和 Output 部分

编者按:Transformers凭借其卓越的性能,已经成为自然语言处理领域的代表性模型架构。但是Transformers的内在机制却比较复杂,对许多读者来说可能还存在一定的难度。本系列对 Transformer各组...

11/13 09:57
13
Embedding技术与应用(3):Embeddings技术的实践应用

编者按: IDP开启Embedding系列专栏,力图详细介绍Embedding的发展史、主要技术和应用。 本文是《Embedding技术与应用系列》的第三篇,重点介绍 嵌入技术在生产环境中的应用效果到底如何。 ...

11/08 10:15
7
轻松理解 Transformers (3): Feed-Forward Layer部分

编者按:随着人工智能技术的不断发展Transformer架构已经成为了当今最为热门的话题之一。前馈层作为Transformer架构中的重要组成部分,其作用和特点备受关注。本文通过浅显易懂的语言和生活中...

11/06 10:00
435
轻松理解 Transformers(2):Attention部分

编者按:随着人工智能技术的不断发展,Transformers 模型架构已成为自然语言处理领域的重要基石。然而,许多人对其内部工作机制仍然感到困惑。本文通过浅显易懂的语言和生活中的例子,帮助读...

10/30 15:26
141
轻松理解 Transformers(1):Input部分

编者按:Transformers 是人工智能领域近年来最引人瞩目的技术之一,它为语言生成模型的发展做出了巨大的贡献。随着大语言模型(LLM)的兴起,公众对其背后的技术原理也越来越感兴趣。但是由于...

10/24 15:34
243
大模型的幻觉 (Hallucination) 因何而来?如何解决幻觉问题?

编者按:目前大模型仍然存在一个非常致命的缺陷——大模型的“幻觉”(Hallucination)问题。为什么 LLM 会出现幻觉?如何缓解这种情况?使用的数据集对此现象的影响几何?今天为大家带来的这...

10/23 10:11
22
RAG (检索增强生成)技术详解:揭秘基于垂直领域专有数据的Chatbots是如何实现的

编者按:相信很多人都对Chatbots背后的技术原理很感兴趣,其实Chatbots并非通过“魔法”与我们交流,而是依靠一种被称为检索增强生成(RAG)的技术。 文章详细梳理了 RAG 技术的具体实现原理...

10/16 11:03
205
Embedding技术与应用 (2) :神经网络的发展及现代Embedding方法简介

编者按:IDP开启Embedding系列专栏,详细介绍Embedding的发展史、主要技术和应用。 本文是《Embedding技术与应用系列》的第二篇,重点介绍神经网络的发展历程及其技术架构,剖析了嵌入技术与...

Embeddig技术与应用 (1) :Embedding技术发展概述及Word2Vec

编者按:嵌入(Embedding)是机器学习中一种将高维稀疏向量转换为低维稠密向量的技术。其通常用于处理自然语言、图像等高维离散数据。 嵌入能够有效地解决维度灾难问题,减少存储和计算成本,同...

基于Falcon-7B模型的QLoRA微调实操:构建面向心理健康领域的Chatbot

编者按:在之前的系列文章中,我们介绍了大模型的原理和微调落地的理论方法。本期文章,我们将以实际场景为例,详细介绍微调的实践流程和相关代码。 作者详细介绍了如何使用 QLoRA 技术针对 ...

微调语言模型前,需要考虑这三个关键方面

编者按:随着大语言模型(LLM)的迅速发展,越来越多团队希望针对特定领域进行模型微调。但是实践运用中总是存在一些困难,直接应用并不总是能达到理想效果。 本文着重探讨了三个关键问题: 利用...

当红语言模型利器:深度解析向量数据库技术及其应用

编者按:随着大语言模型的广泛应用,如何存储和高效检索这些模型产生的大量向量表示成为一个较为关键的问题。本文深入探讨了向量数据库在提升语言模型应用性能方面的作用,并介绍了不同类型向...

为什么企业需要私有化专属大模型

编者按:8月29日凌晨,OpenAI在官网宣布,推出企业版ChatGPT(ChatGPT Enterprise)。前不久,OpenAI又刚刚发布了针对企业的GPT-3.5 Turbo微调功能。因而引发了一场热烈的讨论——是否仍需要...

09/04 10:32
214
如何有效进行RLHF的数据标注?

编者按:随着大语言模型在自然语言处理领域的广泛应用,如何从人类反馈进行强化学习(RLHF)已成为一个重要的技术挑战。并且RLHF需要大量高质量的人工数据标注,这是一个非常费力的过程。 本...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部
http://www.vxiaotou.com