Skip to main content

黑洞资源笔记

  1. AuditNLG是一个开源库,可以帮助降低与使用生成式 AI 系统进行语言相关的风险。它提供并聚合了用于检测和提高信任度的最先进技术,使过程简单且易于集成方法。

    该库支持三个方面的信任检测和改进:真实性、安全性和约束。它可用于确定输入到生成式 AI 模型或从生成式 AI 模型输出的文本是否存在任何信任问题,并提供输出替代方案和解释。

    Factualness:确定文本字符串是否与给定的知识来源事实一致,而不是基于幻觉。它还根据世界知识检查文本是否正确。
    Safety:确定文本字符串是否包含任何不安全的内容,包括但不限于毒性、仇恨言论、身份攻击、暴力、身体、性、亵渎、有偏见的语言和敏感话题。
    Constraint:确定文本字符串是否遵循人类提供的显式或隐式约束(例如做、不做、格式、样式、目标受众和信息约束)。
    PromptHelper and Explanation:该工具提示 LLM 自我完善和重写更好、更值得信赖的文本序列。它还解释了为什么样本被检测为非事实、不安全或未遵循约束。
  2. 具有聊天界面的上下文数据可视化工具,使用自然语言和GPT生成数据集的可视化,可以逐步编辑可视化结果,使其更加准确,无需重新输入整个复杂查询。

    特点包括:自然语言生成数据可视化、使用聊天上下文编辑可视化、允许用户根据预期修改图表、通过与可视化交互逐步探索数据、上传自己的CSV数据集进行可视化、保存可视化和聊天记录、允许用户使用可视化编辑器进行编辑,并根据用户的喜好生成更好的可视化。

    VizGPT | #可视化 #工具
  3. Google的可视化编程框架,可以在无需编程的图形编辑器中创建机器学习(ML)流水线。可以通过连接拖放的ML组件(包括模型、用户输入、处理器和可视化)快速原型化工作流程。

    Visual Blocks提供了节点图编辑器、预置的ML模型和组件库以及输出展示和比较功能,旨在降低ML多媒体应用的开发门槛、加速工作流,并方便用户分享和发布应用

    Visual Blocks | github | #框架
  4. BiLLa: 开源的中英双语LLaMA模型,具有增强的推理能力。通过扩充中文词表和利用任务型数据进行训练,提升了中文理解和推理能力。

    在评测中,BiLLa在中英语言建模和推理任务上表现出色,优于其他模型,并与ChatGLM-6B相比在解题和代码得分方面更高。开发者可以使用BiLLa-7B-LLM和BiLLa-7B-SFT模型,并可通过提供的工具进行模型权重的还原和使用。评测结果显示,BiLLa在语言建模和各种问题类型上取得了良好的性能
  5. CodeGPT: 提高编程能力的关键在于数据。CodeGPT是通过GPT生成的用于GPT的代码对话数据集。现在公开了32K条中文数据,让模型更擅长编程。

    考虑到代码难度对模型训练效果的影响,此处共收集了四种不同类型、不同难度的代码相关对话数据,收集方法如下:

    Code-Basic:利用已有的LLM(例如付费API)生成各种编程语言的基础库函数相关的代码对话数据。Prompt类似“请为C语言中的XX函数生成一道非常简单的编程问题及对应的代码答案”,API会输出该基础库函数相关的问题-答案对,将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。
    Code-Medium:利用已有的LLM(例如付费API)生成中等难度的编程问题及答案,例如写入内容到文件、查找字符串子串、实现链表等,API同样会输出问题-答案对,将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。
    Code-LeetCode:从LeetCode上收集到的问题-答案对,此类问题通常难度较高。将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。
    Code-Text:从互联网上收集到的常见面试题及答案,此类问题并不涉及编程,而是侧重于对各种概念的理解。将问题作为用户输入,答案作为模型输出(文本形式),可得到一条对话数据。
  6. AI驱动文本编辑器,专注于短篇小说创作。

    它使用了LLM(大型语言模型)技术,如PaLM,以预测下一个最可能出现的词。

    Wordcraft通过精心设计的用户界面,探索了通过提示工程技术推动这一技术的极限,并为作家们提供了先进工具的访问权

    Wordcraft | #编辑器
  7. 一个面向律师、法官、检察官、法学教师、学者、学生以及从事法律相关的工作人员的开放型平台,OpenLaw 的用户被视为法律技术和知识的源泉,共同分享法律专业知识以及智慧和经验成果。需要登录注册。但是目前只对认证用户开放。

    OpenLaw
  8. Google IO 2023 视频信息浓缩

    1. Pixel 7a:新款手机,搭载Tensor G2芯片,8GB RAM,相机升级,售价499美元。
    2. Pixel Tablet:11英寸高分辨率显示屏,四个内置扬声器,搭载Tensor G2芯片,具有长久电池寿命和先进的人工智能。提供首个充电扬声器基座,价格为499美元。
    3. Pixel Fold:可折叠手机,具有Tensor G2芯片和AI创新,售价未公布。
    4. Help Me Write:Gmail中的AI辅助写作功能。
    5. Maps中的Immersive View for Routes:全新的路线展示方式,预计今年底将在15个城市推出。
    6. Magic Editor:Google Photos中的图片编辑功能。
    7. Bard:支持20多种编程语言的代码生成器,已开放给全球180多个国家和地区。
    8. Workspace:实时协作功能,将AI整合到Google Docs和Sheets中。
    9. RCS:一种现代化的信息技术标准,取代旧的SMS和MMS技术。
    10. Magic Compose:增强表情符号的功能。
    11. Cinematic和Emoji Wallpaper:将普通照片转换为3D壁纸和表情符号壁纸。

    Google IO强调了AI在多个领域的应用,帮助人们在关键时刻更好地实现目标。这些创新产品和功能将不断完善和扩展,以满足用户的需求。
    Media is too big
    VIEW IN TELEGRAM
  9. Hugging Face 重磅推出 Transformers Agents!

    让所有人都可以轻松使用 OpenAssistant、StarCoder、OpenAI 等大语言模型,快速创建一个 AI 智能代理。

    该代理可接受复杂的查询信息,通过对话的方式,实现文字生成图像、网站摘要朗读、PDF 总结等等功能。

    具体实现可围绕一系列提示词进行构建,流程如下:

    - 明确告知代理的主要任务;
    - 给代理一个工具;
    - 向代理展示示例;
    - 分配任务,让代理通过思维连推理与理解任务,并输出 Python 代码。

    目前,该代理已内置多款实用工具,其中包括:

    - 文档问答功能;
    - 语音转文本、文本转语音;
    - 文本功能(分类、摘要、翻译、下载、问答);
    - 图像功能(生成、转换、字幕、分割、放大、问答);
    - 基于文本直接生成视频,扩展性强。

    文档 | 在线体验
  10. 最新数码馆藏 – 「香港特藏」

    图书馆刚推出的「香港特藏」数码馆藏,内容包括香港早期书籍、教科书、期刊和海报,均为图书馆在过去数十年收集有关香港的馆藏,在取得版权许可及数码化后于「香港中文大学数码典藏」平台作永久保存及开放取用,更多内容将会陆续增加。

    传送门 | #图书馆
  11. 深入浅出现代Web编程 (全栈公开课 2022)| 地址

    一站式学习 React, Redux, Node.js, MongoDB, GraphQL 以及 TypeScript!这门课程会向你介绍基于 JavaScript 的现代 Web 开发技术。重点是利用 ReactJS 搭建单页面应用程序(SPA:Single Page Application),并使用Node.js构建REST API。

    本门课程价值5~12个学分,课程内容与赫尔辛基大学计算机科学系的2021春季课程【全栈课程】相同,这门课附带一个相关的项目作业,价值1~10个学分。

    上课的同学需要具备良好的编程技能、基本的网络编程和数据库知识,并且了解使用 Git 这个版本控制系统的基础知识。 你还需要有坚持不懈的精神以及独立解决问题和搜索信息的能力

    课程的第0部分更详细地介绍了课程的内容和教学方法。 因此一定要仔细阅读材料和课程说明
  12. 数据分析引擎:esProc SPL。拥有低代码、高性能、轻量级和全功能的特点,相较于传统 SQL 技术,使用 esProc SPL 可以显著降低整体应用成本。

    由于 SPL 面向结构化和半结构化数据,因此还可用作分析型数据库和数据计算中间件,应用于线下跑批和在线查询场景。

    其独创的 SPL 语法使编码更简单且运行效率更高。技术特性包括:算法引擎、存储引擎、多源混算、并行框架、敏捷语法、嵌入集成、数据固化和实时数据。

    SPL 支持多数据源混合计算,可无缝集成到应用中,具备良好的集成性和轻量级特性。在性能、开发效率、灵活性和资源节约等方面具有显著优势。