技术,生活,随看 \随转
chat-RPG vite+vue3+daisyUI+animate.css实现基于openAI的text-davinci-003构建属于自己的AI机器人,具体效果展示可参见项目页,适合想简单玩一玩,体验一下的朋友。
感谢网友何师傅的投稿!
🏷 TAG #AI #开源项目
📢 Channel @opencfdchannel
👥 Group @open_source_community
感谢网友何师傅的投稿!
🏷 TAG #AI #开源项目
📢 Channel @opencfdchannel
👥 Group @open_source_community
我们的中文互联网不足以提供高质量的训练数据。什么是高质量的数据?比如维基百科、高质量的活跃论坛、专业新闻、学术论文、高质量代码、图书。
我们看看GPT–3的训练数据是什么。权重最大的数据集是OpenWebText(开源版本),数据是从Reddit论坛上收集的URL,再把内容抓取下来。Common Crawl是一个开放的互联网数据存档(英文占一半,中文大概5%)。其他一些代表性的数据包括Wikipedia维基百科,Books开放图书,Stack Exchange 技术问答社区,Github 代码,ArXiv论文,RealNews 新闻存档,PubMed 医疗数据。可以看到,由中文互联网产生的数据,比例低到可以忽略。这也是困扰很多试图训练中文大模型的问题,但实际上,ChatGPT的用中文沟通的能力,已经远超那些专门的中文大语言模型了,背后原因是GPT隐式学到的翻译能力。
没有好的中文数据,我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生,需要开放的社区,我们似乎无解。
我们看看GPT–3的训练数据是什么。权重最大的数据集是OpenWebText(开源版本),数据是从Reddit论坛上收集的URL,再把内容抓取下来。Common Crawl是一个开放的互联网数据存档(英文占一半,中文大概5%)。其他一些代表性的数据包括Wikipedia维基百科,Books开放图书,Stack Exchange 技术问答社区,Github 代码,ArXiv论文,RealNews 新闻存档,PubMed 医疗数据。可以看到,由中文互联网产生的数据,比例低到可以忽略。这也是困扰很多试图训练中文大模型的问题,但实际上,ChatGPT的用中文沟通的能力,已经远超那些专门的中文大语言模型了,背后原因是GPT隐式学到的翻译能力。
没有好的中文数据,我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生,需要开放的社区,我们似乎无解。
【包括 #zlibrary、#超星、#lorefree、#libgen(含在zlibrary内)、#可知 等】
👩💻 作者有话说:
个人眼中的终极电子书解决方案,欢迎提宝贵的意见和建议,使这个网站功能更完善更具体,也希望大家能够多多分享宣传,谢谢🥳🤩
🔗 易书书籍检索网站:
https://search.yibook.org/
🚀 作者TG频道:
https://t.me/yibook
🤖 群友投稿TG机器人
@tkutuphanebot
(支持中文搜索,似乎也会联动多个数据库/bot检索)
#易书 #书籍检索 #电子书
一个将hacker news订阅信息AI总结输出的频道
这个频道还蛮有意思的,由一个大型语言模型编写的利用GPT将hacker news的自动汇报,同时支持网页输出
频道:https://t.me/hn_summary
网页版:https://news.jiggy.ai
你可以在网页版中使用浏览器翻译中文查看
📡发布:https://noisevip.cn/15727.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
分享一个网站:https://www.kanzhun.com/
看准是BOSS直聘的母公司,是一个和glassdoor类似的定位于雇主点评与职场信息的服务平台。其为用户提供雇主基本信息,雇主评价,薪酬资讯,面试经验,招聘职位等信息,里面的内容都是由企业员工和离职两年内的老员工匿名提供
#社区 #工作 #职业
点此查看详情
看准是BOSS直聘的母公司,是一个和glassdoor类似的定位于雇主点评与职场信息的服务平台。其为用户提供雇主基本信息,雇主评价,薪酬资讯,面试经验,招聘职位等信息,里面的内容都是由企业员工和离职两年内的老员工匿名提供
#社区 #工作 #职业
点此查看详情
本教程与大多数 Git 内部教程不同,因为不会只用文字来谈论 Git,还会用代码来谈论 Git,边学习边用 Python 编写。
这个教程需要具备 Git 的应用知识,所以不适合Git新手。
ugit: DIY Git in Python | #教程
本项目的目标是收录以下内容:
课程资源链接
是否有视频
有哪些作业(homework)、实验(lab/assignment)
是否有自动测评程序(autograder)
课程简介,包括前置课程知识,适合哪个阶段学习等等
课程评价,包括难度、有趣程度、讲课质量、作业难度与质量等等
非官方的优质课程资源链接(如笔记、课程内容翻译等等)
后续课程推荐