人工智能与大模型最新资讯与技术博客

通用基座大模型是否可以超越领域专有大模型？微软最新论文证明这是可以的！微软最新动态Prompt技术——MedPrompt详解

在GPT-4这种超大基座模型发布之后，一个非常活跃的方向是专有模型的发展。即一个普遍的观点认为，基座大模型虽然有很好的通用基础知识，但是对于专有的领域如医学、金融领域等，缺少专门的语料训练，因此可能表现并不那么好。如果我们使用专有数据训练一个领域大模型可能是一种非常好的思路，也是一种非常理想的商业策略。但是，微软最新的一个研究表明，通用基座大模型如果使用恰当的prompt，也许并不比专有模型差！同时，他们还提出了一个非常新颖的动态prompt生成策略，结合了领域数据，非常值得大家参考。

2023/12/06 17:10:17 阅读 1034

MedPrompt/动态Prompt

ChatGPT内置隐藏debug功能：支持下载原始对话、可视化对话分支等

AIPRM的工作人员最近发现ChatGPT的客户端隐藏内置了一个新的debug特性，可以提高ChatGPT对话的问题调试功能。这个特性包含非常多的功能。同时，最新的截图显示ChatGPT Team版本计划可能延迟但没有取消。

2023/12/06 07:43:39 阅读 944

ChatGPT/ChatGPTTeam计划/ChatGPT的Debug模式/新版本ChatGPT

Pika和HeyGen的开源替代品：上海人工智能实验室开源可以生成高质量最长61秒视频的LaVie文本生成视频大模型

最近，初创企业Pika引起了全球的目光。这家公司发布的Pika 1.0产品可以基于生成式AI技术来创建3D动画视频或者电影级别的视频。由于其逼真的效果，引起了很多人的关注。本文则介绍一个由上海人工智能实验室开源的文本生成视频大模型LaVie。这个模型可以根据文本生成高质量的视频内容。

2023/12/05 21:49:09 阅读 1185

LaVie/文本生成视频/视频大模型

ChatGPT即将发布的新版本：增加自动标签管理并去除对ChatGPT回答的点赞按钮

在OpenAI的首次开发者大会上，OpenAI发布了诸多的新功能。但是，ChatGPT目前一个非常难用的功能就是历史记录查询。当前，ChatGPT的历史对话是ChatGPT自动取名标题之后放在左侧，而新截图显示，ChatGPT可能即将上线一个新功能来改进这个管理。

2023/12/01 08:48:36 阅读 719

ChatGPT/自动标签

阿里巴巴开源国内最大参数规模大语言模型——高达720亿参数规模的Qwen-72B发布！还有一个可以在手机上运行的18亿参数的Qwen-1.8B

Qwen系列是阿里巴巴开源的一系列大语言模型。在此前的开源中，阿里巴巴共开源了3个系列的大模型，分别是70亿参数规模和140亿参数规模的Qwen-7B和Qwen-14B，还有一个是多模态大模型Qwen-VL。而此次阿里巴巴开源了720亿参数规模的Qwen-72b，是目前国内最大参数规模的开源大语言模型，应该也是全球范围内首次有和Llama2-70b同等规模的大语言模型开源。

2023/12/01 08:37:44 阅读 3832

Qwen-72B/Qwen大模型/阿里巴巴

StabilityAI发布实时文本生成图片大模型SDXL Turbo——生成一张图片可能只需要0.207秒

StabilityAI是当前最流行的开源文本生成图像大模型Stable Diffusion背后的公司。这家公司在文本生成图片和文本生成视频方面开源了诸多的大模型。其中，Stable Diffusion是目前使用人数最多的开源文本生成图像大模型。就在刚才，StabilityAI又发布了一个全新的实时的文本生成图像大模型Stable Diffusion XL Turbo，这个最新的模型在A100上生成一张图片只需要0.207秒！

2023/11/29 09:36:49 阅读 767

SDXLTurbo/StabilityAI/StableDiffusion/StableDiffusionXLTurbo

2023年11月第四周的HuggingFace流行的十大开源大模型分析——多模态大模型和小规模模型爆发

在本周，HuggingFace最流行的十个大模型多模态模型占了4个，包括StabilityAI最新开源的文本生成视频大模型Stable Video Diffusion、Coqui最新的语音合成大模型XTTS第二代等都吸引了大量的关注多。而大语言模型中，谷歌开源了2022年就已经发布的Switch大模型，该模型号称参数可以达到上万亿，也是十分有意思。

2023/11/26 23:53:44 阅读 4245

HuggingFace/多模态大模型/开源大模型

可能比runway更好！StabilityAI最新开源文本生成视频大模型：Stable Video Diffusion，可以生成最多20帧的视频，但不可商用

在深度学习和计算机视觉的发展历程中，视频生成技术一直是一个极具挑战和创新的领域。而发布了一系列开源领域最强图像生成模型Stable Diffusion系列模型背后的企业StabilityAI最近又开源了一个的文本生成视频大模型Stable Video Diffusion模型，这个模型可以生成最多20帧的视频。测试效果，这个模型普通版本与runway差不多，20帧版本则超过了runway！

2023/11/25 08:23:52 阅读 1604

StabilityAI/StableVideoDiffusion/Text-to-Video/文本生成视频

导致Sam离职风波背后的OpenAI最近的技术突破——Q*项目信息汇总

上周五，OpenAI董事会突然把Sam开除的事件已经结束，闹了好几天之后Sam回归，董事会改组。而这件事的背后导火索有许多传闻，其中最重要的一个是OpenAI可能在最近有一项重大的技术突破，被认为是Sam和董事会分歧的重要原因。而今天，国外的路透社独家消息提到OpenAI内部一个称为Q\*（Q Star）项目取得了非常重大的突破，使得部分人认为AGI很接近，进而引发了一系列事件。本文将根据目前的信息汇总介绍一下Q\*项目。

2023/11/23 18:21:24 阅读 544

Q*/大模型

OpenAI最新动向，Sam不再回归OpenAI，与Greg一起进入微软！OpenAI新任CEO由Emmett Shear接任！

OpenAI的董事会上周五开除Sam Altman，同日其创始人Greg Brockman，这件事引起了轩然大波。周末各方消息显示投资人施压董事会，要求召回Sam。本来大家以为Sam重回OpenAI。但是最新消息，OpenAI找了新的CEO，Sam与Greg等人加入微软成立新的团队。

2023/11/20 16:28:11 阅读 761

Greg/OpenAI/Sam

OpenAI发布2周后有哪些GPTs受欢迎？访问量如何？GPTs两周数据分析

GPTs是OpenAI在其开发者日发布的一项最新的个性化GPT功能。所有人可以基于现有的GPT-4，配合网络流量、文件访问等功能，上传自己的数据，对接自己的接口来构建个性化的GPT，并对外提供服务。那么，2周后的今天GPTs的发展怎么样？有哪些受欢迎的GPTs被大量使用？本文结合各方数据介绍一下当前GPTs的情况。

2023/11/20 00:18:18 阅读 1171

GPTs/GPTs数据分析/OpenAI

DataLearnerAI-GPT：可以回答关于大模型评测结果的GPT

最近自定义GPTs非常火热，出现了大量的自定义GPT，可以完成各种各样的有趣的任务。DataLearnerAI目前也创建了一个DataLearnerAI-GPT，目前可以回答大模型在不同评测任务上的得分结果。这些回答是基于OpenLLMLeaderboard数据回答的。未来会考虑增加更多信息，包括DataLearner网站上所有的大模型博客和技术介绍。

2023/11/12 11:25:50 阅读 1308

DataLearnerAI-GPT/OpenLLMLeaderboard/大模型评测

DataLearnerAI发布中国国产开源大模型生态概览统计：国产开源大模型都有哪些？现状如何？

随着GPT的一路爆火，国内大模型的开源生态也开始火热。各大商业机构和科研组织都在不断发布自己的大模型产品和成果。但是，众多的大模型产品眼花缭乱。为了方便大家追踪国产开源大模型的发展情况，DataLearnerAI发布了中国国产大模型生态系统全景统计（地址：https://www.datalearner.com/china-opensource-llm ），本文也将根据这个统计结果简单分析当前国产开源大模型的生态发展情况。

2023/11/10 17:26:56 阅读 3491

中文大模型/国产大模型/国产开源大模型/大模型

GPT-4-Turbo的128K长度上下文性能如何？超过73K Tokens的数据支持依然不太好！

GPT-4 Turbo是OpenAI最新发布的号称性能超过当前GPT-4的模型。在新版本的ChatGPT中已经可以使用。而接口也在开放。除了速度和质量外，GPT-4 Turbo最吸引人的是支持128K超长上下文输入。但是，实际测试中GPT-4 Turbo对于超过73K tokens文档的理解能力急速下降。

2023/11/09 18:51:48 阅读 2213

GPT-4Turbo/Long-Context/超长上下文/长上下文

李开复创业公司零一万物开源迄今为止最长上下文大模型：Yi-6B和Yi-34B，支持200K超长上下文

零一万物（01.AI）是由李开复在2023年3月份创办的一家大模型创业企业，并在2023年6月份正式开始运营。在2023年11月6日，零一万物开源了4个大语言模型，包括Yi-6B、Yi-6B-200K、Yi-34B、Yi-34B-200k。模型在MMLU的评分上登顶，最高支持200K超长上下文输入，获得了社区的广泛关注。

2023/11/09 18:40:55 阅读 1419

Long-Context/Yi-34B/Yi-6B/零一万物

基于Emebdding的检索增强生成效果不同模型对比：重排序十分有利于检索增强生成的效果

基于Embedding模型的大语言模型检索增强生成（Retrieval Augmented Generation，RAG）可以让大语言模型获取最新的或者私有的数据来回答用户的问题，具有很好的前景。但是，检索的覆盖范围、准确性和排序结果对大模型的生成结果有很大的影响。Llamaindex最近对比了主流的`embedding`模型和`reranker`在检索增强生成领域的效果，十分值得关注参考。

2023/11/08 20:10:29 阅读 3534

RAG/reranker/检索增强生成/重排序

为企业单独定制训练一个GPT-4要多少钱？OpenAI说几个月，200-300万美元起步！

OpenAI的开发者日发布了许多更新。其中，普通用户可以微调GPT-4是非常值得期待的功能之一。但是，OpenAI还有一个针对企业的定制化GPT-4的训练服务，称为Custom Models。而这项为企业单独定制的GPT-4训练服务最新截图显示，需要几个月来训练模型，而且费用是200-300万美元起步！

2023/11/07 19:51:13 阅读 1434

CustomGPT-4/GPT-4/定制GPT-4

OpenAI最新的GPT-4V的多模态API接口是如何计算tokens的？这些计算逻辑背后透露了GPT-4V什么样的模型架构信息？

OpenAI在发布了多模态的GPT-4V（GPT-4 with Vision）的接口，可以实现图像理解的功能（`Image-to-Text`）。这是OpenAI的第一个多模态接口，在以前的接口中，OpenAI都是文本大模型，相关的费用计算都是按照输入输出的tokens计算，虽然与一个单词多少钱有一点差异，但是也算直观。而GPT-4V是一个图像理解的接口，这里的费用计算不像文本的tokens那么直观，那么这个接口的费用计算逻辑是什么？这个计算逻辑透露了什么样的模型架构信息？本文将介绍这个问题。

2023/11/07 16:10:24 阅读 4516

gpt-4-vision-preview/gpt-4-vision-preview费用计算/GPT-4V

OpenAI再度泄露重磅更新，GPT-4即将发布128K的超长上下文版本以及多模态版本，价格下降一大半！

就在刚刚，有网友发现OpenAI的官方的文档接口更新中增加了128K的超长上下文版本，命名为GPT-4-128K-Turbo！

2023/11/06 17:27:48 阅读 2112

GPT-4/GPT-4-128K/GPT-4-128K-Turbo

截止目前为止最大的国产开源大模型发布：元象科技开源XVERSE-65B大模型，16K上下文，免费商用

国产大语言模型的开源领域一直是很多企业或者科研机构都在卷的领域。最早，智谱AI开源ChatGLM-6B之后，国产大模型的开源就开始不断发展。早期大模型开源的参数规模一直在60-70亿参数规模，随着后续阿里千问系列的140亿参数的模型开源以及智源340亿参数模型开源之后，元象科技开源650亿参数规模的大语言模型XVERSE-65B，将国产开源大模型的参数规模提高到新的台阶。

2023/11/06 17:01:56 阅读 1019

XVERSE-65B/国产大模型/开源大模型