Skip to main content

黑洞资源笔记

  1. 《中国大百科全书》第三版网络版 | 主页 | 维基百科 | #百科全书

    此版总条目50万条,总计约5亿字。在第一、二版的基础上,第三版大量增加了学科设置和条目数量,包括了国家颁布的全部学科门类、一级学科和多个知识领域。

    第三版网络版进行多媒体配置,运用文本、图片、音频、视频和交互产品,体现科学性、知识性、文献性、艺术性和可读性,努力实现准确和权威。

    网络版分为专业、专题、大众三个板块。
    1.专业板块框架以科学分类为基础,既要有稳定性,又要具时代性、开放性。专业板块按学科分工编撰,经加工、整合为一体。以大学文化程度的非本专业读者为对象。

    2.专题板块以各种特定专题为中心,以多作者、多视角、多条目汇集的形式编撰。它以内容集中、叙述具体、弥补和扩充专业板块为特点,适合更多读者需求。

    3.大众板块以人们关注的经济、政治、文化、教育、文艺、体育现象及日常生活知识为主编撰,注意雅俗共赏。采用“开放集稿、封闭发布”的运作方式。以中等以上文化程度的读者为对象。

    《中国大百科全书》纸质版紧密依托网络版,其条目从网络版中选出,经过甄选、重组和新撰,形成各学科条目框架,并展示出完整的学科体系。纸质版按学科(知识门类)分类分卷整合编纂。不列卷次,每卷只标出学科(或知识门类)名称。设计规模80卷,每卷字数约200万,选收条目约1500条。总计字数1.2亿~1.5亿;配图约6万幅,其中地图约3000幅,并可采用链接方式与网络版共同阅读。
  2. Zig是一个命令式、通用、静态类型、编译的系统编程语言。 以“强健性、最佳性以及可维护性”为核心理念。 它支持编译时泛型与反射、交叉编译以及手动存储器管理。 目标为改进C语言,同时参考从Rust 和其他语言。Zig 有许多低端程序设计的功能,例如紧致结构、任意大小的整数以及多指针类型。

    学习 Zig》系列教程最初由 Karl Seguin 编写,该教程行文流畅,讲述的脉络由浅入深,深入浅出,是入门 Zig 非常不错的选择。因此,Zig 中文社区将其翻译成中文,便于在中文用户内阅读与传播。
  3. 为了让 LLM 记住更多、记得更好,研究者们正在不断努力。最近,来自 MIT、Meta AI、CMU 的研究者提出了一种名为「StreamingLLM」的方法,使语言模型能够流畅地处理无穷无尽的文本。

    StreamingLLM 的工作原理是识别并保存模型固有的「注意力池」(attention sinks)锚定其推理的初始 token。结合最近 token 的滚动缓存,StreamingLLM 的推理速度提高了 22 倍,而不需要牺牲任何的准确性。短短几天,该项目在 GitHub 平台已斩获 2.5K 星。

    论文 | 项目 | 详文
  4. Open X-Embodiment:迄今为止最大的开源机器人数据集

    包含100多万条来自22个不同机器人平台的实机轨迹数据,汇集了全球34个机器人研究实验室的60个现有数据集。

    基于该数据集训练了两个模型:1) RT-1,一个高效的基于Transformer的机器人控制架构;2) RT-2,一个大规模的视觉语言模型,通过自然语言Token输出机器人动作。

    RT-1-X是在机器人数据混合上训练的RT-1模型。RT-2-X是在机器人数据混合上训练的RT-2模型。

    结果显示,RT-1-X在分布内技能上的表现优于只在单个数据集上训练的原始方法;RT-2-X在新技能上的表现较RT-2提升了3倍,展现了更好的空间理解能力。

    本项目由来自21个机构的研究人员合作完成,为探索通用的机器人策略奠定了基础,以实现机器人经验的有效迁移。
  5. Colab最新更新概览 | link

    借助Colaboratory(简称Colab),可在浏览器中编写和执行Python代码,并且无需任何配置;,免费使用GPU; 轻松共享

    - Colab新增了从Google表格智能粘贴数据的功能,可以自动生成代码将粘贴的数据转换为pd.DataFrame,省去了传统上要进行的额外步骤。
    - Colab还可以从Pandas DataFrame自动生成图表,执行包含DataFrame的代码单元格后,会出现一个自动绘制图表的按钮。
    - Colab Notebook现支持将代码单元格折叠并分组,可以给相关的代码单元格添加小标题,这能让Notebook更整洁有序。
    - 新的文本编辑功能允许选择一个代码单元格然后直接编辑文本,无需转换为Markdown单元格。
    - Colab实验室新增了一些功能让Notebook的协作更容易,如评论和任务列表。
    - Colab Notebook编辑器现在支持语法高亮显示,可以选择不同的配色方案。编辑器还可以实时预览LaTeX数学表达式。
    - Colab增加了新的Notebook设置,可以设置单元格间距、代码字体等使界面更符合个人喜好。
    - Colab optimize运行时选项可以根据硬件情况自动选择运行时,提高Notebook的性能。
    - Colab的Stable Diffusion支持扩展到更多用户,可以通过简单的代码进行图像生成。
  6. Perplexity推出pplx-api,可快速访问开源大型语言模型如Mistral 7B、Llama2 13B等

    - pplx-api易于使用,开发者可以在几分钟内通过REST API整合先进的开源模型。
    - pplx-api推理速度很快,比其他解决方案的延迟降低了2-3倍。
    - pplx-api基础设施经过验证,可以承载产品级流量。
    - pplx-api采用NVIDIA TensorRT-LLM和AWS A100 GPU等先进软硬件,实现了优化。
    - pplx-api已用于Perplexity的产品中,相比外部API每年节省了62万美元成本。
    - pplx-api兼容OpenAI API,可以轻松集成到现有应用中。
    - 未来pplx-api将支持更多定制和开源模型。