黑洞资源笔记

16:22 · Aug 14, 2023 · Mon

小米发布第二代机器狗CyberDog 2：售价12999元

CyberDog 2是小米第二代四足机器人，能够做前后跳、作揖等10种小型犬运动，甚至能实现高难度动作，如前空翻、芭蕾舞步，滑板、太空步等等。

此外，CyberDog 2能像一只真实的小狗一样，理解、回应甚至预测主人的需求和情绪。雷军表示，这款新品主要面向开发者和数码爱好者。
15:57 · Aug 14, 2023 · Mon

youre-the-os：一个计算机游戏，你在其中的角色就是扮演操作系统

你要负责进程调度、内存管理、 I/O 事件等，如果你这个操作系统的使用者发现很多进程没有响应，就会重启系统，你就game over了。
15:40 · Aug 14, 2023 · Mon

stable-diffusion.cpp：纯C/C++实现的Stable Diffusion，采用类似llama.cpp的方式
15:37 · Aug 14, 2023 · Mon

一款面向 SEO 的 AI 自动化写作工具

BlogSEO | #工具

工具
12:01 · Aug 14, 2023 · Mon

标配 12G 起步，M3 Mac 或将取消 8G 内存

来自彭博社的消息，最快将于下个月发布的新款 M3 Mac 家族或将取消 8G 内存的入门机型。消息称目前正在进行测试的新款 MacBook Pro 配备了最高 48GB 的统一内存，根据 Apple Silicon 的传统，Max 版的芯片将会拥有基本版芯片的 4 倍内存，这或许意味着接下来 M3 Mac 将以 12G 内存作为基础配置。
12:00 · Aug 14, 2023 · Mon

书生·万卷1.0为书生·万卷多模态语料库的首个开源版本，包含文本数据集、图文数据集、视频数据集三部分，数据总体超过2TB。

基于大模型数据联盟构建的语料库，上海AI实验室对其中部分数据进行了细粒度清洗、去重以及价值梳理，形成了书生·万卷1.0，具备多元融合、精细处理、价值梳理、数学高效等四大特征。

在多元方面，书生·万卷1.0包含文本、图文、视频等多模态数据，范围覆盖科技、融合、媒体、教育、法律等多个领域，在训练提升模型知识内涵、逻辑推理和泛化推理化能力方面具有显着效果。

在精细化处理方面，书生·万卷1.0经历了甄别语言、正文抽取、格式标准化、基于规则及模型的数据过滤与清洗、多维度重整、数据质量评估等精细化数据处理环节，从而能够更好接地装配后续的模型训练需求。

在价值洞察方面，研究人员在书生·万卷1.0的构建过程中，着眼于内容与中文主流价值观结合的洞察，通过算法与人工评估的方式，提升了语料的纯净度。

在高效建模方面，研究人员在书生·万卷1.0统一格式，并提供了详细的参数字段说明和工具指南，综合考虑了建模性和效率，可快速评估语言、多模态等大模型训练。

目前，书生·万卷1.0已被评估书生·多态、书生·浦语的训练。通过对高质量语料的“消化模型”，书生系列模型在语义理解、知识问答、视觉理解、视觉问答等各类生成式任务表现出了优异的性能。

WanJuan1.0 | #语料库

语料库
04:36 · Aug 13, 2023 · Sun

清华大学教授AMiner创始人唐杰的团队做了一个全新的Agent能力榜单，评估基础模型智能体。

这是一个多维演进基准测试，包括8个不同环境，用于评估大型语言模型（LLMs）在多回合开放式生成环境中的推理和决策能力，通过对25个语言模型的广泛测试，发现顶级商业语言模型在复杂环境中表现出色，且与开源模型之间存在显著差距。AgentBench的数据集，环境，和集成评估包已在 github上发布。

8种不同的环境任务，即操作系统（OS）、数据库（DB）、知识图谱（KG）、卡牌对战（DCG）、情景猜谜（LTP）、家居（Alfworld）、网络购物（WebShop）、和网页浏览（Mind2Web）。

使用 AgentBench 对 25 个不同的语言模型进行了全面评估，揭示了领先的商业语言模型与开源模型之间的显着性能差距。对语言模型作为智能体的更广泛讨论的贡献，表明需要进行严格、系统的评估，并提供强大的开源工具来促进此类评估。

AgentBench | demo | paper
04:24 · Aug 13, 2023 · Sun

智慧图书馆知识资源发布系统，目前有74家图书馆参与了这个系统。

不同图书馆上传内容不同，天津图书馆上传的是旧期刊，金华发的是古籍，也有发旧报纸的，清晰度尚可。

这个系统的特点是分析整理书籍中的“知识颗粒”，机构、人物、事件、地名等，不过不同图书馆整理分析程度不同。

馆口 | #图书馆

图书馆
03:16 · Aug 13, 2023 · Sun

关于如何创建我们自己的搜索引擎优化 (SEO) 工具（如 ahrefs、semrush、Ubersuggest）等的介绍文章 | link
02:58 · Aug 13, 2023 · Sun

开源项目MetaGPT作者直播分享回放，带你深入了解Github Trending世界第一的多智能体框架。解析代码、分享应用实践，帮你从理论到实践全面理解MetaGPT。| bilibili

1:41:13

Media is too big
VIEW IN TELEGRAM
16:47 · Aug 12, 2023 · Sat

About：用 C++ 编写的数字音频工作站(DAW)，支持多种插件格式
16:40 · Aug 12, 2023 · Sat

国外高质量视频课程：Crash Course，中文字幕。| YouTube
16:32 · Aug 12, 2023 · Sat

一个来自于「聪明的阅读者」整理的通识类的书单，包括了各个领域的知识和理解，其中分成了最小 50 本，以及完整的 1000+ 书籍整理 | Excel
16:24 · Aug 12, 2023 · Sat

数据科学项目的命令行生成器

Sicarator | #生成器

生成器
16:20 · Aug 12, 2023 · Sat

Obsidian Importer 1.1 推出，可以更轻松地将数据转换为持久的纯文本文件，供永久离线访问。可与Notion、Bear、Google Keep、Evernote和HTML文件文件夹配合使用