技术,生活,随看 \随转
2月3日晚间,美国俄亥俄州边界东巴勒斯坦地区一火车脱轨,导致大量危化品氯乙烯和盐酸泄露并持续燃烧,当地空气和水源遭到污染。
CNN等美国主流媒体在早期简单报道了列车脱轨的事故,将事故定性为train crash。6日,周边居民上传到tiktok的环境灾害视频引发关注。

俄亥俄州州长于8日召开了新闻发布会,正式公布了环境灾害问题。发布会期间一名黑人记者不明原因被逮捕,再次引发舆论关注。

氯乙烯是1类致癌物,大老鼠吸入500毫克就急性中毒,吸入500ppm会引起肌肉骨骼畸形、孕期内胚胎中毒、孕期内胚胎发育异常。此次泄漏了10万加仑,对生态影响巨大,据估计当地50年内无法住人。

https://twitter.com/LPMisesCaucus/status/1624749331919011853?s=20

🤖 投稿:@ZaiHuabot
📣 频道:@TestFlightCN
是不是经常混淆人工智能、机器学习、深度学习、深度神经网络、人工智能模型、对抗神经网络、卷积神经网络、大语言模型、GPT-3等等概念?

没关系,画个图就清晰了。
【来自投稿】1918年,19岁的海明威在意大利米兰的医院里,他在前线两个膝盖和右脚被打穿,仍然背着一名意大利士兵走了近一个小时到达红十字会医院,身体里嵌入两百多枚弹片,差点截肢,医生只取出一部分,剩下十枚留在身体里 source
机翻:Polymath 使用机器学习将任何音乐库(例如来自硬盘驱动器或 YouTube的)转换为音乐制作样本库。该工具自动将歌曲分成词干(节拍、低音等),将它们量化为相同的速度和节拍网格(例如 120bpm)并分析音乐结构(例如主歌、副歌等)、调性(例如 C4、E3等)和其他信息(音色、响度等)。结果是一个可搜索的示例库,它简化了音乐制作人、DJ 和 ML 音频开发人员的工作流程。
chat-RPG vite+vue3+daisyUI+animate.css实现基于openAI的text-davinci-003构建属于自己的AI机器人,具体效果展示可参见项目页,适合想简单玩一玩,体验一下的朋友。

感谢网友何师傅的投稿!

🏷 TAG #AI #开源项目
📢 Channel @opencfdchannel
👥 Group @open_source_community GitHub - Lumberjackisok/chat-RPG: vue3,vite......基于openAI的text-davinci-003构建属于自己的AI机器人
我们的中文互联网不足以提供高质量的训练数据。什么是高质量的数据?比如维基百科、高质量的活跃论坛、专业新闻、学术论文、高质量代码、图书。

我们看看GPT–3的训练数据是什么。权重最大的数据集是OpenWebText(开源版本),数据是从Reddit论坛上收集的URL,再把内容抓取下来。Common Crawl是一个开放的互联网数据存档(英文占一半,中文大概5%)。其他一些代表性的数据包括Wikipedia维基百科,Books开放图书,Stack Exchange 技术问答社区,Github 代码,ArXiv论文,RealNews 新闻存档,PubMed 医疗数据。可以看到,由中文互联网产生的数据,比例低到可以忽略。这也是困扰很多试图训练中文大模型的问题,但实际上,ChatGPT的用中文沟通的能力,已经远超那些专门的中文大语言模型了,背后原因是GPT隐式学到的翻译能力。

没有好的中文数据,我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生,需要开放的社区,我们似乎无解。
Back to Top