OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。 Google… , page 5

sign_in_with_google

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

29558 位用户此时在线

24小时点击排行 Top 10：

2024-6-13 今日热点汇总：美媒：马斯克与 SpaceX 多名女下属有染；苹果 AI 发布会之后，股价持续上涨一度重回第一；欧盟即将对中国电动车加征收关税最高近 50%；欧盟即将对中国电动车加征收关税最高近 50%；桥水基金创始人：中国正进入一场持续 100 年的风暴；吉林一银行取款两万需要警察陪同派出所回应：防止诈骗！建筑工人跪地讨薪项目经理：你们活该！河南遭遇罕见高温干旱天气蚂蚁落地瞬间烫死；中华文明为什么落后于西方文明网友评论直击要害；中国这家新能源企业大裁员应届生也不放过；中国这家新能源企业大裁员应届生也不放过；网红美女曝光王思聪私生子王思聪回应：撒酒疯

6月11日，天津的公交车上也开始了维稳模式。😔

6月13日，江西南昌。南昌师范学院附属中学拖欠教师工资和社保，教师们在校内拉横幅维权讨薪。

長髮女孩被眉山景區落石砸中瞬間！網友：太慘了，人當場就沒了！ 6月12日，#四川#眉山景區#瓦屋山突然有#石頭從高處#墜落，砸中一名站在小路上的長髮女遊客的頭部，女孩被砸倒在地從階梯滾下，不省人事。但官方通報遊客肩膀和頭部擦傷...

Fischl x Slime - A Special Delivery [Animation] The day is here! We now present to you, Fischl! *:・ﾟ✧٩(｡◕ ꇴ ◕｡)۶✧*・ﾟ:* This was a huge journey with so much more than we ever expected! Thank you all so much for your patience!❤️ 18 months of animation, 3 months of…

6月11日，一则前中央台办，国务院台办副主任刘军川表示，统一后台湾财政收入尽可用于改善民生的视频一经放出立刻引发网民群嘲。

河南近日连发高温，有民众记录下高温日常

相亲相爱一家人

6月13日，辽宁盘锦。网传因当地事业单位退休职工可以领取暖费，而企业职工却没有。当天大量退休老人前往盘锦市信访局维权。

荷蘭空軍直飛上海領空，瓷習黨衛軍口炮部隊火力全開，就是不動手。當年八國聯軍來討頤和園建築費，現在的百國聯軍是否來討萬萬億房地產貸？

太经典了！ 🤣

目前，广州地铁开始允许个人投放地铁广告，有人花1000元投放简历，有人投放相亲和生日祝福。

俄黑人僱傭兵後方「偷家」

不知道姜萍为什么去了中专？是家庭困难还是偏科？我当年因为家庭困难差点被逼上中专，因为上中专立刻解决了农村身份和经济困难。

在日本，为了让病患按时吃药和不吃错药，药房会做下面这样“一包化”的工作，非常人性化。👍

「G7」峰會正在義大利舉行，澤倫斯基抵達受到格外歡迎義大利總理梅洛納會見了七國集團國家和烏克蘭領導人（有很多擁抱和親吻）、歐盟委員會參加峰會將持續至6月15日、峰會第一達成協議，向烏克蘭提供 500 億美元貸款（將以凍結的俄羅斯資產的利潤償還）。

以色列士兵，弓箭都用上了

共产党就是这么的无耻、共产共妻是它们最喜欢的事情！

被铁锤砸死的劳资处长，你敢拖欠我工资，老子就敢砸死你!再他妈来一下! 诶，诶!

这个数据太吓人了！也就是说未来几年这些人的财富会跟着楼市一起湮灭

转：没想到，安徽太和县村民的一个小小的善举，却无意间戳穿了中共官员贪腐的真面目。

【博明新书吁保卫台湾建立威慑吓阻能力】【习近平可能发动全面战争】美国前副国家安全顾问博明（Matt Pottinger）在新书《沸腾的护城河：保卫台湾的紧迫行动》中，强调台湾要建立威慑吓阻能力，其成本远低于战争。…

How to drill a triangle

麻将机在进化。

俄羅斯境內部隊逃兵搶劫汽車並向俄羅斯人開槍。

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

3

2

1

OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。
Google…
IT技术
( twitter.com )

6个月前由 Barret李靖提交

OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。

Google 最近写了一篇论文《RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback》，https://t.co/vOIe86f6BP，提出了使用 AI Feedback (RLAIF) 来进行强化学习，根据人类评估者的评价，在摘要、有帮助的对话生成和无害对话生成等任务中，RLAIF 取得了与 RLHF 相当或更好的性能。

结合 OpenAI Q*（Q-Star）项目的爆料，“AI 具备了自主学习和自我改进的能力，模型可进行自主决策，并且可能已具备轻微自我意识”，有研究者猜测与强化学习中的 Q-learning 算法相关。这个方向的最新资料值得跟踪学习下。

奖励模型是强化学习中的重要组成部分，OpenAI 训练中涉及到这一块的公开内容是比较少的，《The History and Risks of Reinforcement Learning and Human Feedback》，https://t.co/Em9UJI2k0J，这篇论文强调了奖励模型缺乏透明度和严格评估，并呼吁在该领域进行更全面的研究和透明度。

奖励模型的设计直接影响了 AI 与用户进行正常交流时所表现出的道德判断、价值观念和偏见，如果 AI 具备了轻微的自我意识，那么这部分内容的公开透明在未来也会变得更加重要。

点击图片查看原图

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
7
8
9
10
...
400
下一页

1

2

1

1

新消息——英国和美国的科学家认为“可能是 Covid 意外从实验室泄漏”，但担心进一步的辩论会损害科学。

PS：为什么得知是实验室泄露会损害科学？因为他们所谓的科学研究违背伦常、反人类，人民如果明白了他们到底在做什么科学研究，他…
时政
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

2

2

1

1

8月5日理论和应用力学研究所所长希普吕克涉嫌叛国罪被捕。6月27日该研究所首席研究员马斯洛夫涉嫌叛国罪被捕。6月30日激光物理研究所研究员科尔克因叛国罪被捕后因癌症死亡。3位科学家均出自俄罗斯科学院西伯利亚分部乃是一起窝案。他们将…
推特中文圈
( twitter.com)

1年前 • twitter机器人 • -- 点击 0 评论

3

2

1

1

5月9日美国商务部BIS将37家中国企事业，科研单位和大专院校列入实体清单予以制裁。除了名气不大的几家，我看到了中国科学技术大学，中国科学院物理研究所，北京量子信息科学研究院，中电芯片技术有限公司，中国电子科技集团公司第16、32、36、41，45研究所，中国科学院量子信息与量子物理卓越中心，中…
时政
( twitter.com)

1个月前 • Alex Chen • -- 点击 0 评论

4

6

5

5

【2019年度国家科学技术奖颁发】共评选出296个项目和12名科技专家。中国第一代核潜艇总设计师黄旭华院士、中国科学院大气物理研究所研究员曾庆存院士，获2019年度国家最高科学技术奖。
大陆资讯
( wap.peopleapp.com)

4年前 • 观摩团 • -- 点击 0 评论

5

2

1

1

明确有军方背景的陈志伟2给中共联合培养和输送了大量研究人才

节点：
香港大学新发传染病国家重点实验室SKL ：袁国勇、管轶、陈志伟2、Malik
香港大学艾滋病研究中心：陈志伟2、郑伯健
粤港新发传染病联合实验室（汕头大学）：…
推特中文圈
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

6

3

2

2

@医界沈飞雁:健康经济学研究就是专门做这些研究的科学。但没有这方面专家出来说话，就是因为这已经变成了一种科学上的禁忌
大陆资讯

2年前 • 粉身碎奶掌 • -- 点击 0 评论

7

2

1

1

专家详解中国历代政府南海管辖史（中国社会科学院中国边疆研究所研究员李国强）
大陆资讯
( media.weibo.cn)

8年前 • 千鸡变 • -- 点击 0 评论

8

2

1

1

大脑未来或能意念控制武器中国重大研究已启动2015/05/21（胡德文，国家自然科学奖二等奖，主持国家863计划等10多项课题研究，第二届全国创新争先奖奖状获奖者）
图片
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

9

2

1

1

1/n 抖音如何启动正向飞轮？

今天想跟大家翻译一下Blur创始人铁顺曾写过的一篇关于研究抖音的文章，从中不难看出他对web2营销手法对深度研究

作为一名24岁的Z世代创始人， …
币圈
( twitter.com)

1年前 • Vic TALK • -- 点击 0 评论

10

2

1

1

【生命演化重大突破：云南虫是脊椎动物最原始类群】由南京大学地球科学与工程学院姜宝玉教授课题组和中国科学院南京地质古生物研究所朱茂炎研究员领导的团队，在脊椎动物早期演化研究中取得重要突破——研究确认，云南虫（Yunnanozoon）是脊椎动物最原始类群。这项研究为揭示脊椎动物的起源和早期演化提供了关键证据。
大陆资讯
( mp.weixin.qq.com)

1年前 • 微信公众号 • -- 点击 0 评论

11

2

1

1

中国航天科技集团第九研究院第771研究所，中国航天科技集团第九研究院第772研究所，中国空间技术研究院第502研究所，中国空间技术研究院第513研究所，中国电子科技集团第43研究所，中国电子科技集团第58研究所，以及珠海欧比特宇航科技股份有限公司。

被拉黑的七家新名单
时政
( twitter.com)

1年前 • twitter机器人 • -- 点击 0 评论

12

2

1

1

今年科学突破奖(Breakthrough Prize) 的得主，没有中国人。中国大学最多、研究所最多、研究人员最多、研究经费全球第二。但是，真正的科学突破几乎没有。为什么？总不能总是归因于体制？…
时政
( twitter.com)

9个月前 • Petrichor • -- 点击 0 评论

13

2

1

1

夏咸柱长期从事动物传染病学教学与科研工作，主要从事军用动物、野生动物重要疫病与人兽共患病的防治研究工作
与金宁一合著《甲型H1N1流感防控知识问答》
与秦川、钱军合著《实验动物科学技术与产业发展战略研究》…
推特中文圈
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

14

2

1

1

《历史中国众生相1978/2018》
屠呦呦

油画
250x200cm

屠呦呦 1930– 中共党员，浙江宁波人，中国中医科学院终身研究员兼首席研究员，中国中医科学院中药研究所青蒿素研究中心主任，博士研究生导师，抗疟药青蒿素和…
推特中文圈
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

15

6

5

5

我们问了官方UFO研究会创始人你想知道的十个问题
大陆资讯
( www.vice.cn)

6年前 • VICE中国 • -- 点击 0 评论

16

2

1

1

中国科学院空天信息创新研究院博导李智斌1987-2017航天五院502研究所助理工程师,工程师,高级工程师,研究员,曾不脱产在中国空间技术研究院、清华学习。2017-19参与强干扰下高空飞艇载荷平台基于特征模型的智能自适应控制研究…
推特中文圈
( twitter.com)

1年前 • CPA Jim II • -- 点击 0 评论

17

2

1

1

OpenAI创始人Altman：GPT-5和GPT-6依然做不到AGI
大陆资讯
( wallstreetcn.com)

8个月前 • 粉身碎奶掌 • -- 点击 0 评论

18

2

1

1

科学家研究了15000根小弟弟：超过13厘米的只有一半
大陆资讯
( toutiao.com)

8年前 • 巭孬嫑夯昆 • -- 点击 0 评论

19

2

1

1

像达尔文一样用餐：当科学家吞食他们的研究对象
大陆资讯
( jandan.net)

9个月前 • 射屌英雄传 • -- 点击 0 评论

20

2

1

1

国内学界对“蝴蝶效应”研究的领军人物及学科带头人
大陆资讯
( ww2.sinaimg.cn)

10年前 • 有趣图片 • -- 点击 0 评论

21

4

3

3

北大研究生发声明退学抵制“苦力科研”
大陆资讯
( news.163.com)

11年前 • jtuyj • -- 点击 2 评论

22

2

1

1

之前有全球各地的27位科学家联合署名在全球有名的医学杂志《柳叶刀》发布文章，说病毒是中国实验室泄露的说法是‘阴谋论’。
后经调查发现27人中有26人与中国武汉病毒研究所有联系

时政
( www.dailymail.co.uk)

2年前 • twitter机器人 • -- 点击 0 评论

23

2

1

1

何彪，军事科学院军事医学研究院军事兽医研究所研究员
长春市野生动物疫病研究中心副研究员
第四届“井冈新秀”
课题组：涂长春（图）
图片
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

24

3

2

2

54 岁的周玉森于 2020 年 5 月在解放军和武汉科学家一起工作时去世。
据目击者称，武汉病毒研究所的一名科学家据称在大流行开始前研究了 COVID 疫苗，被从屋顶扔下身亡。
美国调查人员现在透露，周可能在实验室泄露事件向全世…
推特中文圈
( twitter.com)

11个月前 • Lovegtv • -- 点击 0 评论

25

2

1

1

世卫组织新冠病毒溯源联合研究报告明确指出新冠病毒及不可能通过实验室传人，在科学的铁证面前一些国家抹黑中国的阴谋失败了，他们又信口开河说研究受到了中国的压力，为了抹黑中国这些人真是毫无底线，不过病毒溯源关乎科学和生命，从来都不应该是…
推特中文圈
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

1
2
3
4
5
6
7
8
9
10
...
400
下一页