Mistral AI放出Mixtral 8x7B, 基于Mixture of Experts (MoE)的开源模型，效果不错。但在我看来，MoE是transformer时代LSTM-GRU，是NLP古早的范式，architecture engineering，非常old school。核心方法是加一些gate来加强Efficient Training at…

发布时间: 2023-12-13 08:30:45

1分

数据加载中

关注推特

收听电报

2

1

0

Mistral AI放出Mixtral 8x7B, 基于Mixture of Experts (MoE)的开源模型，效果不错。
但在我看来，MoE是transformer时代LSTM-GRU，是NLP古早的范式，architecture engineering，非常old school。核心方法是加一些gate来加强Efficient Training at…
时政
( twitter.com )

2年前由 Sverige_ Dong-seok🇸🇪 提交

Mistral AI放出Mixtral 8x7B, 基于Mixture of Experts (MoE)的开源模型，效果不错。

但在我看来，MoE是transformer时代LSTM-GRU，是NLP古早的范式，architecture engineering，非常old school。核心方法是加一些gate来加强Efficient Training at Scale，简言之目的是为了低成本训练，而不是为了塑造专家模型。

而Mixture of Experts的名字，太具迷惑性了，字面意思似乎是各种专家模型的组合起到1+1>2的效果。但实际看看Mixtral 8x7B，8个mistral 7b，b b不一样，但没有一个是专家模型，之所以叫做expert，居然是MoE中的FNN，我十分怀疑FNN能有什么专家能力。

它的benchmarking也理所当然的跟通用大模型GPT3.5/Llama 2相比，比较的是generic能力，并没有什么突出的专家能力。粗算了一下，8x7B float16, 至少需要100GB以上GPU显存，cost巨大。在这种情况下，oss的情怀，不足以说服我不用OpenAI的api。

如果我们停下来想想，什么是expert。
首先，expert能力一定不是通用大模型的generic的能力，而是独特的specialization的能力。例如会写code的GitHub copilot，或会generate思科路由器配置命令，甚至特别会planning，特别会算数都是专家能力都算。
简言之，expert能力是会产生特定领域特定输出的能力。所以，MoE是一个好名字，在这个时代，缺有些名不副实。

而做specialization模型的技术，依然在发展，并且依然是前沿，其实就是lora微调，例如Stanford's Alpaca models项目等等，核心思想就是在开源模型上加adapter，使之能够完成一个具体领域的专家工作，其实Mistral AI的开源7b模型估计也是这么做出来的。

未来，大语言模型作为agent的时代在实际中的应用，一定是llm在中间协调多种多样不同7b抽象出来的api，来完成新的human computer interaction。甚至在特定领域，这个协调工作也可以被planning expert的开源模型替代，而协调的过程，还是离不开 CoT，React，ReWoo或者其他的prompting方法。

CoT, ReAct在我的推中已经分享过好几次了，接下来找时间把ReWoo, 几个微调的介绍（跳票很久了）分享给大家。

Markdown支持

评论加载中...

您可能感兴趣的：

1

523

522

522

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

2

481

480

480

平时女神范的学姐其实是一个喜欢刺激和学弟们无套4p的骚货呀。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 4 评论

3

96

95

95

真的是,龟公到了极点了。刺激我的已经不是黑白的反差了
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

4

375

374

374

有阿朱的脑残粉们
私信喷我
说阿朱不是快餐妹
这是她男朋友
这智商是怎么知道推特的
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

5

687

686

686

尝尽了男欢女爱,人生也没有什么遗憾了呀。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 4 评论

6

208

207

207

投稿@Fengsiyuan @91porm 成都游、牛奶和热狗一个都不能少、还是研究生比较疯狂 #重庆线下 #成都线下 #研究生
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

7

95

94

94

绿帽淫，情趣开裆黑丝袜，无套插入，每一次都深深插入，绿帽王八，一边看着老婆被干，一边告诉单男用力操这个骚货，把精子射在他的逼逼里，骚货超级抗干，期待更多大鸡吧征服她.后续更精彩，野外漏出，勾引，公园啪啪，文字限制不一一介绍了
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

8

419

418

418

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

9

193

192

192

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

10

139

138

138

据说是某老公为了上位，让自己老婆充当小姐和领导一起多p的，最终不知道有没有如愿呢？反正老婆应该是爽到了！
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

11

95

94

94

上一个是她自己拍的，这个是我的角度
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

12

337

336

336

请尽情的侵犯我吧，我会尽全力的，请尽情的插小穴和我的菊花，拜托你们看着我高潮时的样子~

（更多H动漫成人视频请留意评论区，或还可全屏视频点击链接）
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

13

155

154

154

巨乳姐姐洗澡视频完整版过了门槛的小哥哥vx上找我观看哦。
另外，抽一个同城的小哥哥一起洗澡，给我留言吧❤️
@xiaolaqiuzhang
@shenmingss
@Xijierqi
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

14

486

485

485

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

15

140

139

139

有的时候，女孩也可以主动❤️‍
这样我们之间的距离会更深入
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

16

225

224

224

乡村学生妹和表哥乱仑直播,假期在家赚生活费,疫情原因男友不能来，只能找帅气表哥凑合啦！插入的一瞬间无比销魂！
投稿@pubccs @yuziqoq感谢

完整版观看地址在评论区

porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

17

265

264

264

爸爸，谢谢你收养我！无以为报，唯有以身相许！

完整版链接在评论区首条或视频中间弹幕
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

18

591

590

590

喜欢你被撞的每一下
活动圆满结束
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

19

750

749

749

老公既然同意了,那享受就完了。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

20

211

210

210

上个视频吧，最近找不到什么衣服拍了，你们还有什么想看的可以给我提议哦，前提是180能穿得下的，没准我下次就上身了
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

21

239

238

238

当你看完这几段视频后，你会发现这两个“歹徒”做到最后也没弄懂，到底是要控制精液，还是榨干精液

（全片观影地址在评论区，或打开视频点击链接下载搜索关键词即可观看）
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

22

74

73

73

Watch video
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

23

374

373

373

又要睡着了，抓紧时间发
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

24

41

40

40

同事加班我偷懒这一天根本没有心思工作了… 满脑子想着回家玩棒棒怎么办啊怎么办啊，戒不掉了 #反差婊 #骚货 #母狗 #露出
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

25

93

92

92

今天的游戏环节，谁来猜一下这两个男的，哪位是单男？哪位是老公呢？猜对的我抽几个给福利哟~~
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论