大语言模型微调之道3——微调在训练过程中的位置 #大语言模型微调之道… , page 3

sign_in_with_google

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

32999 位用户此时在线

24小时点击排行 Top 10：

2024-6-26 今日热点汇总：16诺贝尔经济学奖得主：特朗普当选将加剧通胀；加拿大计划对华电动车征税；纽约时报：韩国电池工厂起火，为何死者多为中国劳工；中国总理李强称用中医理论挽救经济网友：没救了！外交部回应日本校车遇袭案：偶发事件，中国最安全；北京老人强迫年轻女生让座用拐棍扒拉女生大腿内侧；胡锡进 A 股一周年，亏损总亏损 74597 元；余承东称主动安全是华为提出来的，网友：汽车是华为发明；OpenAI 重大调整，禁止中国使用其 API

人贩子太可恨了司机师傅你真是积德啊！

英雄永生！

https://t.co/rUaiueVzSC

6月25日，此前在安徽大学江淮学院学生抗议时堵门不让学生外出的黑衣人出现在合肥警方的宣传视频中。确认此前堵住校门的不明身份人员为合肥警察。

6月25日，湖南永州水情。

夏季灭蚊神器

大粪坑底层充满戾气大粪坑顶层充满杀气 …… 合在一起就形成了： “洋溢着乐观向上的氛围”

🔥 博士后的大学老师夫妻，创业卖煎饼，讲人生意义的看法，这样简单生活，自己喜欢就好，比较轻松，没有压力！

6月26日，山东济宁。一名环卫工因天气热在树下歇息被领导骂，躺在地上大哭。网友呼吁：工会在哪里？

看恶魔怎么在光天化日之下毫无理由的折磨人！

6月26日，西藏。一名博主称，自己在湖边摆摊卖奶茶，来了一队旅客未经允许坐他摆放的椅子。他上前理论，结果遭遇领队殴打锁喉。视频显示，博主的眼睛红涨，口腔和颈部有多处伤痕。

6月25日，广州。一男子带自己发烧到39℃的孩子前往医院，遭遇交警扣车不让走。

6月24日(发布) 河南许昌。一男子发视频称，他全款买了金科鹿鸣帝景的房子，结果开发商要求买车位才能交房，可即使买了车位，开发商也不一定交房。不仅如此业主代表也因维权被拘留。业主去北京上访，接着又会被驳回到许昌归属地。男子表示，希望国家更高层次的人能出面救黎明于水火。

6月26日，海银暴雷投资者前往上海市公安局维权。多人被警察带走。

内蒙古呼市嫌犯仍在逃。但是评论区翻车了。

网友投稿广东深圳，交警埋伏围捕电动车

#乌克兰战报乌克兰国防部视频：俄罗斯入侵者没有关坦克门。对不起！乌克兰无人机投下的一枚美国 M67 手榴弹，摧毁了俄罗斯坦克。

要做中國人就不要談自由，要談自由就不要做中國人。——倪匡

脚本写得有点意思…… 视频【街头采访：看起来是国货，实际上是外国的牌子有哪些？】

通过搜索可发现，目前网上还存在着大量的“抗日锄奸队”

中国急了……

6月26日，广东深圳。因秘鲁总统到访导致后海人行天桥突然禁止通行，引起众多市民不满。另一位市民反映，滨河大道往西方向限制车辆出行，一分钟才有两辆车通行。

☀️善良才得已保全！ 2024年6月18日，内蒙古呼市土默特左旗霍文常，灭门村霸一家五口，唯独放过仇家儿媳妇...

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

大语言模型微调之道3——微调在训练过程中的位置

#大语言模型微调之道…
IT技术
( twitter.com )

10个月前由宝玉提交

大语言模型微调之道3——微调在训练过程中的位置

#大语言模型微调之道

在这节课，我们深入探讨了训练中微调的真正位置和它的重要性。微调是一个关键步骤，发生在预训练之后，帮助我们优化模型以适应特定的任务。刚开始，模型是完全随机的，对世界知之甚少。但通过大量从互联网上抓取的数据预测下一个词，模型逐渐学习并掌握了语言。

我们还讨论了如何为微调准备数据。从抓取的数据到更结构化的问题答案格式，每种格式都有其优点。而微调的数据需求比预训练少得多，因为我们是在已有的模型基础上进行优化。这意味着，与其从头开始，不如在已有的知识上进行建设，使其达到更高的水平。

此外，微调不仅仅是技术层面的。它可以明显改变模型的行为，使其更适应特定场景或任务。例如，在聊天界面中，我们希望模型能够提供更稳定和聚焦的回应。通过微调，模型的响应性和准确性都得到了显著提高。

最后，我们也展望了未来的课程内容。下一节，我们将专注于一种特别的微调方法——指令微调。这是一个非常实用且强大的方法，希望大家不要错过！

课程地址：https://t.co/LgsFiv9DQf

YouTube：https://t.co/W60XfOyKZ9
B站：https://t.co/0GRNNMoG8H

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
7
8
...
205
下一页

1

2

1

1

#AI开源项目推荐：LlamaGPT

一个类似于ChatGPT的应用服务，但是可以运行在本机或者局域网中，不用担心数据泄露的风险。

背后的LLM是用的Llama 2，它是基于 ggml 调用LLM，所以没有好显卡也能运行，只是速度会慢一些。另外模型越大，需要的内存也越高。…
IT技术
( twitter.com)

10个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:00:24

2

2

1

1

读到：「如果你想去中国旅行，需要使用中国手机、中国应用程序，还需要一张中国的银行/信用卡。即使是简单的访问著名旅游景点，现在也要扫描二维码、在中文应用程序上输入个人信息，并填写各种中文表格。这些障碍对于中国人来说可能微不足道，但在西方人眼里，一是对国际游客极度不友好，二是政府集权…
时政
( twitter.com)

9个月前 • 雨夜漫步大祭司 • -- 点击 0 评论

3

2

1

1

上推目的

我为什么抓住“英语”和“弱者”这两个话题不放，总认为解决了这“两大难题”，会大大的改进华人移民生活。

不断地强调“听、说、读、写”，还放了几十个学习的网站和软件，根本不是我语言上有什么造旨，而是这样可以帮到最多的人。…
时政
( twitter.com)

10个月前 • Vic Wong 黄维克 • -- 点击 0 评论

4

2

1

1

给微软一点小小的中国震撼...

IT技术
( github.com)

10个月前 • Cyandev.app • -- 点击 0 评论

5

1

0

0

感谢程老在脸书上的回复。不过还是有中国粉红留言说谁也没问过我，我这个不答应可不是回应谁的问话，而是回应中国人流氓的行为。这叫路见不平拔刀相助，难道还要流氓来问我吗？
我一定会去台湾看望程老，我们再喝茅台。
时政
( twitter.com)

10个月前 • QQ.FM Zhang Lei • -- 点击 0 评论

6

2

1

1

今天看见这么个评论。其实，生活在民主国家的普通人（不仅仅是左翼，但更多的出现在左翼）对极权国家的政治和言论上的一些精微之处，是完全无法理解的。…
时政
( twitter.com)

10个月前 • 小径残雪 • -- 点击 0 评论

7

2

1

1

这群老外banker也真是中国通了。。。用242指代习近平。。。习近平的拼音语调。。。牛逼。。。墙内文化输出了
时政
( twitter.com)

10个月前 • Red Panda Research • -- 点击 0 评论

8

2

1

1

过去几年，微信或支付宝等电子支付系统在中国大陆广泛普及，让人们基本实现了“出门不带钱包”。相比之下，香港的电子支付发展显得滞后很多。电子支付在香港面临何种困境呢？香港可以迎头赶上吗？
时政
( twitter.com)

10个月前 • BBC News 中文 • -- 点击 • 下载视频 0 评论

00:06:00

9

1

0

0

说起老周的微信，有个很有趣的往事。当年360跟腾讯打的你死我活，老周是不敢用微信的，生怕被腾讯定位跟踪下黑手干掉，也不让大家用，不过后来随着3Q大战平息，老周也用上了微信，但他的微信是装在一个被安全环境设定好的手机里，可以避免跟踪个人信息。其实当年老周的个人安危还是风险很高的，平时都…
时政
( twitter.com)

10个月前 • QQ.FM Zhang Lei • -- 点击 0 评论

10

2

1

1

8家大模型获批上线，可向全社会开放，百度商汤王小川在列
大陆资讯
( 36kr.com)

10个月前 • 墙头看世界 • -- 点击 0 评论

11

1

0

0

中午剥葡萄给小朋友吃，借机狠狠地给他普及了一波进程同步知识。包括生产者（我）消费者（他），生产速度、消费速度，速度不匹配导致的等待与饥饿，引入缓冲区（一个盘子），缓冲区容量限制与缓冲区溢出，缓冲区对生产消费速度不稳定的调节作用，轮询模式与事件通知模式的优缺点……不过全程没用一个计…
时政
( twitter.com)

10个月前 • 象牙山刘能 • -- 点击 0 评论

12

2

1

1

这是什么逻辑？

很多宗教都有暴力史，十字军东征就是其一。

尽管我是基督徒，但我要检视自己所信仰的宗教在发展过程中的历史，而不是拿着放大镜去诟病其它宗教。

而且这种论调也是匪共常常用来洗地它们对维吾尔进行种族灭绝的罪恶行径。尽管你在前面强调了支持维吾尔人对中共暴政的反抗。…
时政
( twitter.com)

10个月前 • Suyutong • -- 点击 0 评论

13

3

2

2

微信读书连扫描版的pdf都能转成原生的文字阅读
一个巨大的震惊
微信团队瑞思拜 #大产品小细节
IT技术
( twitter.com)

10个月前 • 即刻精选 • -- 点击 0 评论

14

2

1

1

找工作部分的坎坷程度稍微超出预料了🥲 本来点开前已是有心理准备
时政
( blog.yuusann.com)

10个月前 • 2BAB • -- 点击 0 评论

15

2

1

1

推荐一个学业规划在线软件。

首先声明这个软件我没用过，十多年来它有了很多改进，现在家长也可以参与在里面。

软件除了协调课堂和课外活动外，管理学分之间的升级/转换，最主要帮你规划你日后的就业。

简单来说，整个学业过程中，贯穿着就业的考量。学完了到底想做什么？软件可以一直用到大学。
时政
( twitter.com)

10个月前 • Vic Wong 黄维克 • -- 点击 0 评论

16

2

1

1

小學五年級小編還在折紙飛機，這孩子已經會做神轎模型了！

圖文報導：

#歐元昊 #神轎模型 #Taiwan #台湾


时政
( news.ltn.com.tw)

10个月前 • Inty热点新闻 • -- 点击 0 评论

17

2

1

1

受到打击后，这只袋鼠便开始了拳击训练，心中已经埋下了复仇的种子。

🦘
有趣
( twitter.com)

9个月前 • 👁️ 我看好你 👁️ • -- 点击 • 下载视频 0 评论

00:00:05

18

1

0

0

有海外网友在前身是推特的X平台上转发了 #台湾当归这篇文章，下面有跟帖展开实时民调，其中只给出两个选项。在近1万3千张投票中，有超过60%的人支持“#中华民国统一中国”，只有38%的人支持“#中国共产党统一中国”。

时政
( www.rfa.org)

10个月前 • Inty热点新闻 • -- 点击 0 评论

19

1

0

0

中文社交媒体上有人翻出了毛泽东的一段语录，用它来斥责谁，不言而喻。对于中共来说，这也可以说是“以子之矛，攻子之盾”。
时政
( twitter.com)

10个月前 • 高伐林 • -- 点击 0 评论

20

1

0

0

揭秘缅北偷渡者的“黑监狱”卡院丨在缅甸果敢老街，“卡院”有很多个，被不同的“家族”和“盘口”把持。从“卡院”成功逃跑的可能性微乎其微。阿甘在缅北的日子里，只见过一次成功逃脱。
大陆资讯
( news.sina.com.cn)

10个月前 • 潜力股 • -- 点击 0 评论

21

3

2

2

近日，网传深圳“网红”交警熊警官在直播查酒驾时，查到深圳一区政府区长，第二天熊警官被调离到大鹏新区。

对此，熊警官在粉丝群中回应称：“太扯了，这完全是谣言！”此外，接近熊警官的相关人士也对记者表示，熊警官去大鹏是正常调动，“自己想去的”。

完全自愿💪💪🏿
时政
( twitter.com)

10个月前 • ***土隹 • -- 点击 0 评论

22

3

2

2

孔子学院VS韩流
这是经济学人统计的美国学习第二语言课程的人数。
因为科技的进步，翻译软件的普及学习第二语言一直在下降。
但是韩语却在逆风提升，这主要得益于鱿鱼游戏，防弹少年团等韩国流行文化的爆火。
中国真的想宣传自己的文化，需要的不是孔子学院，而是我们的鱿鱼游戏
时政
( twitter.com)

10个月前 • 多伦多方脸 • -- 点击 0 评论

23

3

2

2

中国的教育正在排斥英文，因为英文世界让中国人明白语言表达需要逻辑，获得真相的信息，这是中国人的大敌。不过排斥英文减少英文的学习会产生一些非常严重的后果，先不说读科技文献困难重重，就从编程来说，几乎都是英文环境。当然，中国人可以研发国产操作系统支持中文编程，但服务器环境可没那么简单…
时政
( twitter.com)

10个月前 • QQ.FM Zhang Lei • -- 点击 0 评论

24

3

2

2

知情人士对路透社表示，🇺🇸国务院即将任命资深外交官兰伯特为处理🇨🇳中国问题的最高官员。
美国国务院对华政策协调办公室也被称为“中国之家”，曾在东亚积累过丰富外交经验的兰伯特想必将对“中国之家”施加影响。但一般认为，对兰伯特的任命料不会改变拜登政府现行对华政策基调。

时政
( p.dw.com)

10个月前 • DW 中文- 德国之声 • -- 点击 0 评论

25

1

0

0

国内大模型备案终于落地。
长夜漫漫，终现曙光。
IT技术
( twitter.com)

10个月前 • orange.ai • -- 点击 0 评论

1
2
3
4
5
6
7
8
...
205
下一页