Skip to main content

黑洞资源笔记

  1. CodeGPT: 提高编程能力的关键在于数据。CodeGPT是通过GPT生成的用于GPT的代码对话数据集。现在公开了32K条中文数据,让模型更擅长编程。

    考虑到代码难度对模型训练效果的影响,此处共收集了四种不同类型、不同难度的代码相关对话数据,收集方法如下:

    Code-Basic:利用已有的LLM(例如付费API)生成各种编程语言的基础库函数相关的代码对话数据。Prompt类似“请为C语言中的XX函数生成一道非常简单的编程问题及对应的代码答案”,API会输出该基础库函数相关的问题-答案对,将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。
    Code-Medium:利用已有的LLM(例如付费API)生成中等难度的编程问题及答案,例如写入内容到文件、查找字符串子串、实现链表等,API同样会输出问题-答案对,将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。
    Code-LeetCode:从LeetCode上收集到的问题-答案对,此类问题通常难度较高。将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。
    Code-Text:从互联网上收集到的常见面试题及答案,此类问题并不涉及编程,而是侧重于对各种概念的理解。将问题作为用户输入,答案作为模型输出(文本形式),可得到一条对话数据。
  2. AI驱动文本编辑器,专注于短篇小说创作。

    它使用了LLM(大型语言模型)技术,如PaLM,以预测下一个最可能出现的词。

    Wordcraft通过精心设计的用户界面,探索了通过提示工程技术推动这一技术的极限,并为作家们提供了先进工具的访问权

    Wordcraft | #编辑器
  3. 一个面向律师、法官、检察官、法学教师、学者、学生以及从事法律相关的工作人员的开放型平台,OpenLaw 的用户被视为法律技术和知识的源泉,共同分享法律专业知识以及智慧和经验成果。需要登录注册。但是目前只对认证用户开放。

    OpenLaw
  4. Google IO 2023 视频信息浓缩

    1. Pixel 7a:新款手机,搭载Tensor G2芯片,8GB RAM,相机升级,售价499美元。
    2. Pixel Tablet:11英寸高分辨率显示屏,四个内置扬声器,搭载Tensor G2芯片,具有长久电池寿命和先进的人工智能。提供首个充电扬声器基座,价格为499美元。
    3. Pixel Fold:可折叠手机,具有Tensor G2芯片和AI创新,售价未公布。
    4. Help Me Write:Gmail中的AI辅助写作功能。
    5. Maps中的Immersive View for Routes:全新的路线展示方式,预计今年底将在15个城市推出。
    6. Magic Editor:Google Photos中的图片编辑功能。
    7. Bard:支持20多种编程语言的代码生成器,已开放给全球180多个国家和地区。
    8. Workspace:实时协作功能,将AI整合到Google Docs和Sheets中。
    9. RCS:一种现代化的信息技术标准,取代旧的SMS和MMS技术。
    10. Magic Compose:增强表情符号的功能。
    11. Cinematic和Emoji Wallpaper:将普通照片转换为3D壁纸和表情符号壁纸。

    Google IO强调了AI在多个领域的应用,帮助人们在关键时刻更好地实现目标。这些创新产品和功能将不断完善和扩展,以满足用户的需求。
    Media is too big
    VIEW IN TELEGRAM
  5. Hugging Face 重磅推出 Transformers Agents!

    让所有人都可以轻松使用 OpenAssistant、StarCoder、OpenAI 等大语言模型,快速创建一个 AI 智能代理。

    该代理可接受复杂的查询信息,通过对话的方式,实现文字生成图像、网站摘要朗读、PDF 总结等等功能。

    具体实现可围绕一系列提示词进行构建,流程如下:

    - 明确告知代理的主要任务;
    - 给代理一个工具;
    - 向代理展示示例;
    - 分配任务,让代理通过思维连推理与理解任务,并输出 Python 代码。

    目前,该代理已内置多款实用工具,其中包括:

    - 文档问答功能;
    - 语音转文本、文本转语音;
    - 文本功能(分类、摘要、翻译、下载、问答);
    - 图像功能(生成、转换、字幕、分割、放大、问答);
    - 基于文本直接生成视频,扩展性强。

    文档 | 在线体验
  6. 最新数码馆藏 – 「香港特藏」

    图书馆刚推出的「香港特藏」数码馆藏,内容包括香港早期书籍、教科书、期刊和海报,均为图书馆在过去数十年收集有关香港的馆藏,在取得版权许可及数码化后于「香港中文大学数码典藏」平台作永久保存及开放取用,更多内容将会陆续增加。

    传送门 | #图书馆
  7. 深入浅出现代Web编程 (全栈公开课 2022)| 地址

    一站式学习 React, Redux, Node.js, MongoDB, GraphQL 以及 TypeScript!这门课程会向你介绍基于 JavaScript 的现代 Web 开发技术。重点是利用 ReactJS 搭建单页面应用程序(SPA:Single Page Application),并使用Node.js构建REST API。

    本门课程价值5~12个学分,课程内容与赫尔辛基大学计算机科学系的2021春季课程【全栈课程】相同,这门课附带一个相关的项目作业,价值1~10个学分。

    上课的同学需要具备良好的编程技能、基本的网络编程和数据库知识,并且了解使用 Git 这个版本控制系统的基础知识。 你还需要有坚持不懈的精神以及独立解决问题和搜索信息的能力

    课程的第0部分更详细地介绍了课程的内容和教学方法。 因此一定要仔细阅读材料和课程说明
  8. 数据分析引擎:esProc SPL。拥有低代码、高性能、轻量级和全功能的特点,相较于传统 SQL 技术,使用 esProc SPL 可以显著降低整体应用成本。

    由于 SPL 面向结构化和半结构化数据,因此还可用作分析型数据库和数据计算中间件,应用于线下跑批和在线查询场景。

    其独创的 SPL 语法使编码更简单且运行效率更高。技术特性包括:算法引擎、存储引擎、多源混算、并行框架、敏捷语法、嵌入集成、数据固化和实时数据。

    SPL 支持多数据源混合计算,可无缝集成到应用中,具备良好的集成性和轻量级特性。在性能、开发效率、灵活性和资源节约等方面具有显著优势。
  9. 如何写出一个更好的 ChatGPT Prompt

    关于 prompt engineering,有各种各样的技术,但是对于普通用户来说,门槛还是太高了。有大佬训练了上万条不同的 prompt,然后做了这个 Prompt Generator Copilot。| 地址

    只需要告诉它你的需求,就可以进行快速创建