技术,生活,随看 \随转
是不是经常混淆人工智能、机器学习、深度学习、深度神经网络、人工智能模型、对抗神经网络、卷积神经网络、大语言模型、GPT-3等等概念?

没关系,画个图就清晰了。
【来自投稿】1918年,19岁的海明威在意大利米兰的医院里,他在前线两个膝盖和右脚被打穿,仍然背着一名意大利士兵走了近一个小时到达红十字会医院,身体里嵌入两百多枚弹片,差点截肢,医生只取出一部分,剩下十枚留在身体里 source
机翻:Polymath 使用机器学习将任何音乐库(例如来自硬盘驱动器或 YouTube的)转换为音乐制作样本库。该工具自动将歌曲分成词干(节拍、低音等),将它们量化为相同的速度和节拍网格(例如 120bpm)并分析音乐结构(例如主歌、副歌等)、调性(例如 C4、E3等)和其他信息(音色、响度等)。结果是一个可搜索的示例库,它简化了音乐制作人、DJ 和 ML 音频开发人员的工作流程。
chat-RPG vite+vue3+daisyUI+animate.css实现基于openAI的text-davinci-003构建属于自己的AI机器人,具体效果展示可参见项目页,适合想简单玩一玩,体验一下的朋友。

感谢网友何师傅的投稿!

🏷 TAG #AI #开源项目
📢 Channel @opencfdchannel
👥 Group @open_source_community GitHub - Lumberjackisok/chat-RPG: vue3,vite......基于openAI的text-davinci-003构建属于自己的AI机器人
我们的中文互联网不足以提供高质量的训练数据。什么是高质量的数据?比如维基百科、高质量的活跃论坛、专业新闻、学术论文、高质量代码、图书。

我们看看GPT–3的训练数据是什么。权重最大的数据集是OpenWebText(开源版本),数据是从Reddit论坛上收集的URL,再把内容抓取下来。Common Crawl是一个开放的互联网数据存档(英文占一半,中文大概5%)。其他一些代表性的数据包括Wikipedia维基百科,Books开放图书,Stack Exchange 技术问答社区,Github 代码,ArXiv论文,RealNews 新闻存档,PubMed 医疗数据。可以看到,由中文互联网产生的数据,比例低到可以忽略。这也是困扰很多试图训练中文大模型的问题,但实际上,ChatGPT的用中文沟通的能力,已经远超那些专门的中文大语言模型了,背后原因是GPT隐式学到的翻译能力。

没有好的中文数据,我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生,需要开放的社区,我们似乎无解。
易书书籍检索:支持多个优质书库的一站式电子书搜索方案
【包括 #zlibrary#超星#lorefree#libgen(含在zlibrary内)、#可知 等】

👩‍💻 作者有话说:
个人眼中的终极电子书解决方案,欢迎提宝贵的意见和建议,使这个网站功能更完善更具体,也希望大家能够多多分享宣传,谢谢🥳🤩

🔗 易书书籍检索网站:
https://search.yibook.org/

🚀 作者TG频道:
https://t.me/yibook

🤖 群友投稿TG机器人
@tkutuphanebot
(支持中文搜索,似乎也会联动多个数据库/bot检索)

#易书 #书籍检索 #电子书
#网址 #网站
一个将hacker news订阅信息AI总结输出的频道
这个频道还蛮有意思的,由一个大型语言模型编写的利用GPT将hacker news的自动汇报,同时支持网页输出
频道:https://t.me/hn_summary
网页版:https://news.jiggy.ai
你可以在网页版中使用浏览器翻译中文查看
📡发布:https://noisevip.cn/15727.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
Back to Top