大模型公司的技术能力分级 – Neohope的网络笔记

1、研发大模型算法，要有强大的科研团队
比如Transformer、StableDiffusion

2、在上述理论上，改进并模型结构，并提供预训练模型，要有海量算力和海量优质数据
比如ChatGPT、Llamma、千问、Kimi，也包括一些采用“知识蒸馏”技术的公司

3、自有大模型，简单问题自有模型解决，复杂问题集成外部模型功能
比如苹果

4、在预训练大模型上进行调优，并辅助RAG技术，要有算力和大量行业优质数据
比如保险行业大模型、健康行业大模型，华为盘古大模型做的就是这个生意

5、直接使用多个外部大模型，进行能力整合
比如Perplexity

6、直接使用预训练大模型，并进行RAG调优，需要有行业数据积累
各类行业垂直“大模型”

7、直接使用外部大模型，优化提示词，声称自己有大模型能力
比如各类套壳公司

8、直接使用国外大模型，进行转发
比如各类转发网站

9、根本没用大模型技术，直接包装原有功能，四处忽悠
比如各类噱头公司

PS：
其实还有几类公司，类似于美国淘金时代，卖铲子、卖水、卖牛仔裤的公司：
1、提供硬件的公司，尤其是GPU制造厂商
2、提供GPU算力的公司
3、主要从事大模型培训，不管上面几类公司是否赚钱了，这些培训公司可真赚钱了

Leave a Reply Cancel reply