Skip to main content

黑洞资源笔记

  1. 苹果公司的 Apple Vision Pro 头显获得了一项技术专利,可模拟生成花香等多种气味。

    该专利名称为:「非可见现象的可视化」,这项专利旨在弥补增强现实、虚拟现实和物理环境之间的差异,通过计算机生成来增强内容,让佩戴者感知无线电等不可见特征。

    此外,苹果声称该专利可以模拟各种气味,例如花香和水果香味。如果用户在虚拟场景中进入花店或水果店,就可以闻到相应的香味。

    除了模拟气味外,专利中提到的一些无法看见的特性包括电磁信号(如Wi-Fi)、HVAC系统的气流,以及物理对象的温度。专利还提到用户可能会与为宠物和音乐乐器产生声音的听觉传感器进行交互。这将大幅提升用户的沉浸感。

    据 Apple 介绍,该专利的目的在于弥补AR与VR和物理环境之间的差异,这将让用户体验到更为真实的虚拟世界。
  2. Jupyter发布官方子项目Jupyter AI,将生成式AI引入Jupyter notebooks,赋予用户解释和生成代码、修复错误、概括内容、询问关于本地文件的问题以及从自然语言提示生成整个notebook的能力。

    使用强大的魔术命令和聊天界面,Jupyter AI将Jupyter与来自AI21、Anthropic、AWS、Cohere和OpenAI等供应商的大型语言模型(LLM)连接起来。Jupyter AI 1.0适用于JupyterLab 3,Jupyter AI 2.0适用于JupyterLab 4,并且现已作为免费的开源软件发布 | link
  3. 腾讯正在内测一款新的社交应用。

    腾讯内部正在研发一款名为「M8」的社交应用,由 QQ 团队打造,定位是基于地图的虚拟社交产品。产品或于 8 月份对外开启测试。

    在 M8 里,用户可通过地图查看朋友的位置、状况,包括手机电量、名字、定位、驻留时长等,以及发送消息、分享有趣的地点或活动。地图上的用户,既可以熟人之间交友,也可以和地图中的陌生人进行交友聊天。

    这是腾讯时隔两年,再度研发的一款重量级别的社交产品。
  4. 基于LLM的系统和产品的构建模式 | link

    讨论了如何将大型语言模型(LLM)应用于系统和产品中的实用模式,介绍了七种关键模式,包括评估性能、使用外部知识、微调模型、缓存技术以减少延迟和成本、设置保护措施确保输出质量、设计防御性用户体验来处理错误、收集用户反馈来建立数据循环。

    深入讨论了如何使用各种评估指标来衡量模型性能,包括BLEU、ROUGE、BERTScore和MoverScore等;提到了如何使用检索增强生成技术(RAG)将外部信息嵌入到模型中,提高生成质量和可用性。
  5. Meta开源了AI 音频生成工具 AudioCraft,包含 3 个模型:

    - MusicGen 文本生成音乐
    - AudioGen 文本生成音频
    - EnCodec 损失更少的音频压缩

    demo | blog | MusicGen在HuggingFace 上的测试地址