强烈赞同这个观点，模型/算法/数据，数据=知识➕经验。所谓知识，是被语言化之后，可以通过学习去获得的；而经验，是在一个具体场景里的充分知识，世界上的绝大部分经验都未被语言化(文字化→数据化)，且需要通过大量的训练来获得。…

sign_in_with_google

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

32094 位用户此时在线

24小时点击排行 Top 10：

2024-6-13 今日热点汇总：美媒：马斯克与 SpaceX 多名女下属有染；苹果 AI 发布会之后，股价持续上涨一度重回第一；欧盟即将对中国电动车加征收关税最高近 50%；欧盟即将对中国电动车加征收关税最高近 50%；桥水基金创始人：中国正进入一场持续 100 年的风暴；吉林一银行取款两万需要警察陪同派出所回应：防止诈骗！建筑工人跪地讨薪项目经理：你们活该！河南遭遇罕见高温干旱天气蚂蚁落地瞬间烫死；中华文明为什么落后于西方文明网友评论直击要害；中国这家新能源企业大裁员应届生也不放过；中国这家新能源企业大裁员应届生也不放过；网红美女曝光王思聪私生子王思聪回应：撒酒疯

恒大歌舞团团长白珊珊挑战全网陀螺舞大雄：单从舞者角度说基本功还是相当不错的。从国内肮脏的环境来讲，那就不好说了她是一名冲锋陷阵的战士，她是一位攻城略地的将军，她是为恒大拿下项目的斗士 …… 你一跳，跳空了六个钱包；你一跳，跳崩了无数楼房。

6月11日，天津的公交车上也开始了维稳模式。😔

6月13日，江西南昌。南昌师范学院附属中学拖欠教师工资和社保，教师们在校内拉横幅维权讨薪。

長髮女孩被眉山景區落石砸中瞬間！網友：太慘了，人當場就沒了！ 6月12日，#四川#眉山景區#瓦屋山突然有#石頭從高處#墜落，砸中一名站在小路上的長髮女遊客的頭部，女孩被砸倒在地從階梯滾下，不省人事。但官方通報遊客肩膀和頭部擦傷...

6月11日，一则前中央台办，国务院台办副主任刘军川表示，统一后台湾财政收入尽可用于改善民生的视频一经放出立刻引发网民群嘲。

Fischl x Slime - A Special Delivery [Animation] The day is here! We now present to you, Fischl! *:・ﾟ✧٩(｡◕ ꇴ ◕｡)۶✧*・ﾟ:* This was a huge journey with so much more than we ever expected! Thank you all so much for your patience!❤️ 18 months of animation, 3 months of…

一中国女生和黑人谈恋爱怀孕了，黑人让她堕胎，女生情绪崩溃，在街上大骂“cnm，每天知道操我，吃我的穿我的用我的”……

2024-6-14 今日热点汇总: 韩国统一部长官金暎浩朝鲜的配给制度已完全崩溃；普京恐访朝鲜美韩警告：或深化军事联系；G7首脑达成政治协议拟用俄罗斯被冻结资产收益援乌；中国近期的安全重点可能表明了进攻台湾的计划；中国 Metoo 领导者公民记者黄雪琴被判入狱五年；广西广东部分城市取消城管编制引发抗议；南昌一中学拖欠教师工资，教师们拉横幅维权讨薪；湖南一音乐学院书记性骚扰女生辅导员：就当被狗舔了；国务院台办副主任刘军川称统一后台湾财政收入尽可用于改善民生；江苏 17 岁中专生自学数学获得全球数据竞赛第十二名

这个发生在哪个国家？美国？印度、日本？新闻联播没有报啊？横店拍抗日片？日本鬼子太坏了，断子绝孙的野兽！

麻将机在进化。

中国人放出来就是祸害😗还是被共产党关起来好，至少不出来害人🤷

多地發生民眾上街，厲害國驚力倍受挑戰。

南昌师范学院附中，教师们集体讨薪，校长也无可奈何。连公立省级重点高中都拖欠工资，可以想象，共产党地方财政已经在崩溃的边缘了。

目前，广州地铁开始允许个人投放地铁广告，有人花1000元投放简历，有人投放相亲和生日祝福。

被文明世界定性為不文明行為的「中華蹲」醜到四腳朝天，然而在厲害國卻被捧上天，厲害國以醜為美，以醜贏天下。

This happened in the city of Handan in May. A pretty girl was raped by her classmate whose mom is a CCP official. The boy stayed in jail only for a few days. The girl took suicide. Her mom drove to the boy’s neighborhood, ran over the boy’s mom then the boy himself, killed both.

河南近日连发高温，有民众记录下高温日常

共产党就是这么的无耻、共产共妻是它们最喜欢的事情！

6月13日，辽宁盘锦。网传因当地事业单位退休职工可以领取暖费，而企业职工却没有。当天大量退休老人前往盘锦市信访局维权。

人生就是一场浪漫的旅行，长短都差不多，你的厚度和纬度，决定你生命的价值～～🥹

太经典了！ 🤣

#乌克兰今日💕 情人从前线归来。。。不不，那个小子回来了，让我好好舔一舔。

转：没想到，安徽太和县村民的一个小小的善举，却无意间戳穿了中共官员贪腐的真面目。

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

强烈赞同这个观点，模型/算法/数据，数据=知识➕经验。
所谓知识，是被语言化之后，可以通过学习去获得的；而经验，是在一个具体场景里的充分知识，世界上的绝大部分经验都未被语言化(文字化→数据化)，且需要通过大量的训练来获得。…
时政
( twitter.com )

1个月前由 Janet 提交

强烈赞同这个观点，模型/算法/数据，数据=知识➕经验。

所谓知识，是被语言化之后，可以通过学习去获得的；而经验，是在一个具体场景里的充分知识，世界上的绝大部分经验都未被语言化(文字化→数据化)，且需要通过大量的训练来获得。

人类的知识总量是一定的，1.4亿本书的总量+每年几十万本书的增量，今天的大模型压缩的是人类的知识，从这个维度上来说，边界是完全看得见的。如果仅仅停留在知识的层面，大模型能力被拉平只是时间和资源的问题，今年以来已经越来越是一张明牌。

然而，人类在日常的生活和工作中，解决绝大部分问题，靠的恰恰是未被语言化的经验，这些经验包括遗传的以及后天习得的。那么，从这个角度看，我们不难理解，今天大模型能力即使已经很强，也无法很好在实际场景中去有效解决问题，TA 有知识但无法通过实践去获得 skills。

从生产和生活角度看，特定场景+包含人类 skills 的数据训练，对于在特定 domain 的有效性就变得异常关键，这一点Tesla的 FSD 已经初步做出了有效验证。

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
...
400
下一页

1

2

1

1

🧭导航

首页：

中国政策数据库：

美联储数据库：

宏观因子模型：…
时政
( twitter.com)

1年前 • 洋同学的宏观笔记 • -- 点击 0 评论

2

2

1

1

数据分析：《加密货币进入牛市还是熊市》
我不希望我的观点影响你的判断
所以个人观点我会强烈注明
大部分只展示数据和结果
图片
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

3

2

1

1

其实，做科研没那么复杂，一方面做基础数据，一方面做数据计算和分析。
不过要把这两方面做好，可就要见功夫了，怎么能获得更精准的数据，和用什么模型算法处理数据，就要靠你的知识结构和思想水平了。…
时政
( twitter.com)

11个月前 • QQ.FM Zhang Lei • -- 点击 0 评论

4

2

1

1

推荐阅读《向量数据库》，这篇文章很长，但是很详细，无论是入门还是进阶，都有知识点可以学习到。

主要介绍了向量数据库的原理和实现，包括向量数据库的基本概念、相似性搜索算法、相似性测量算法、过滤算法和向量数据库的选型等等。

IT技术
( guangzhengli.com)

10个月前 • 宝玉 • -- 点击 0 评论

5

2

1

1

JS 语言著名的数据库工具包 Prisma，官网上面有一个数据库教程（英文），讲解数据库基本概念和 ORM 关系模型的用法，内容不错。
IT技术
( www.prisma.io)

9个月前 • ruanyf • -- 点击 0 评论

6

3

2

2

开源之光:RedPajama重塑大语言模型的未来
LLaMA最强平替，超12万亿训练数据，全开源
1. 开源12万亿训练数据，参考LLaMA数据集配比。
2. 模型马上开源
*标题由Claude生成…
推特中文圈

开源推荐
( twitter.com)

1年前 • nash_su • -- 点击 0 评论

7

2

1

1

给大家推荐一个好用的工具，这个工具值不值200个点赞？

兄弟们说了算！！

实用工具：比特币所有的模型及数据一网打尽

恐惧与贪婪、彩虹图、Stock-to-Flow 、黄金比例、持有者盈亏天数、闪电网络、算力规模、鲸鱼…
币圈
( twitter.com)

1年前 • 花花研究院 • -- 点击 0 评论

8

2

1

1

StableDiffusion最强大的插件ContorlNet今天更新了1.1版本，这是一个很大的更新，旧模型增加了很多数据进行了重新训练，还新增了几个模型，目前模型总数达到了14个，新增了4个模型。可能会给SD带来新的玩法。下面…
推特中文圈
( twitter.com)

1年前 • 歸藏 • -- 点击 0 评论

9

3

2

2

【北京打响大模型地方战第一枪】《若干措施》从算力、数据、算法、应用、监管五大方向，对北京大模型发展提出了21项措施。
大陆资讯
( zhidx.com)

1年前 • 千鸡变 • -- 点击 0 评论

10

2

1

1

怎么获得躺平币
注册Gettr，GTV、GNEWS，根据发帖转发点赞留言的数量、粉丝量，直播者根据直播时间观看量点赞数转发量，观看者根据观看时间、留言互动、转发链接，发文章的根据发文数量浏览量点赞量留言量转发量，获得躺平币

躺平…
推特中文圈
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

11

2

1

1

📘 想要构建一个AI产品？这是一整套完整的工具

1. 模型：开源 vs 闭源
2. 部署
3. 合成数据
4. 微调与数据标注
5. 数据存储与检索
6. 模型监督
7. 模型的安全性、安全防护和合规性
8. 应用框架
IT技术
( twitter.com)

11个月前 • GPTDAOCN • -- 点击 0 评论

12

2

1

1

「工作人员随机点击一个蓝点，即可看到车企、型号、车辆识别代码（VIN）、行驶里程、剩余电量等实时数据，每辆新能源车的位置数据、发动机数据、报警数据、电池数据、电机数据等十多类、百余项数据都在这个系统里实时更新。」

推特中文圈
( c.m.163.com)

3年前 • twitter机器人 • -- 点击 0 评论

13

2

1

1

【金星曾经是「第二个地球」】研究者们已经根据地球气候模型建造出金星在数十亿年前的计算机模型。
大陆资讯
( jandan.net)

7年前 • 煎蛋网 • -- 点击 0 评论

14

2

1

1

对四个10B左右参数模型的研究表明，微调数据量并不是越大越好。

Alpaca 数据集 52k 效果弱于 9k。
时政
( twitter.com)

10个月前 • 九原客 • -- 点击 0 评论

15

2

1

1

【大流行期间的监测系统靠谱吗？】大规模核酸退场之后，感染数据也进入了模型估算时代。在青岛的疫情通报中提到：“按照监测数据推测”；东莞的疫情通报则是“根据数字模型预测结合专家评估判断”。
大陆资讯
( mp.weixin.qq.com)

1年前 • 中国人兽保险公司 • -- 点击 0 评论

16

2

1

1

失信人数据已经不公布了，这个数字只能从法拍房数量来推算了
时政
( twitter.com)

3个月前 • 小径残雪 • -- 点击 0 评论

17

2

1

1

印度也有了自己的“克强指数”，不过……这一数据比“令人振奋的”官方数据悲观多了
大陆资讯
( wallstreetcn.com)

8年前 • 读书顶个鸟用 • -- 点击 0 评论

18

2

1

1

训练自己的大语言模型（LLM）的九大理由

1.、数据隐私：你的数据在自己的控制之下，不会被泄露给竞争对手或遭受第三方数据泄露的风险。

2.、所有权：你的团队能够自行构建和控制模型，同时建立和增强自己的AI技术和专业知识。……
IT技术
( twitter.com)

1年前 • GPTDAOCN • -- 点击 0 评论

19

2

1

1

🔗

DB-GPT 是一个实验性的开源项目，使用本地化 GPT 大型模型与数据库和环境进行交互。

它通过支持本地部署并为所有基于数据库的场景提供完整的私有大型模型解决方案来确保数据…
IT技术
( twitter.com)

1年前 • AI 托我给您带个话 • -- 点击 0 评论

20

2

1

1

数据好看了-消费强劲，形势大好，让世界惊羡
数据不佳了-回归理性，为消费逆行拒买点赞
图片
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

21

2

1

1

理论上最接近ChatGPT的模型，终于有人训练出来了， orca_mini_3b！

基于OpenLLaMa-3B模型，运用WizardLM，Alpaca和Dolly-V2数据集的指导及输入，并采用Orca研究论文的数据集构建方法…
IT技术
( twitter.com)

11个月前 • Jeffery Kaneda　金田達也 • -- 点击 0 评论

22

2

1

1

Wikimedia Wikisource 数据集，现在已经在 Hugging Face Hub 上提供。
- 数据集包含了来自 Wikimedia Wikisource 的最新转储
- 涵盖了 73 种不同的语言
- 数据以 Parquet 格式提供
- 可用来增强语言模型，更好地理解和生成文本
- 免费使用
下载：
IT技术
( huggingface.co)

6个月前 • 小互 • -- 点击 0 评论

23

2

1

1

往下数年，人工智能模型将拥有比现在多10倍的数据。
数据越多，模型产生的结果越精准。
2020年，全球数据总量为47泽字节。2030年，600泽字节。
13倍的增长。人工智能的能力增长也将数倍计。
人工智能模型5-10年内一定会更…
时政
( twitter.com)

1年前 • 徐老猫 • -- 点击 0 评论

24

2

1

1

马斯克的大模型 Grok-1 开源了，这是一款拥有3140亿参数的先进混合专家模型，截止目前参数量最大的开源大语言模型。
这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。这意味着模型尚未经过针对特定应用（如对话系统）的微调。
根据Apache…
IT技术
( twitter.com)

2个月前 • 宝玉 • -- 点击 0 评论

1
2
3
4
5
6
...
400
下一页