Skip to main content

黑洞资源笔记

  1. Meta-Speaker:一种仅在空气中的一个点发出声音的扬声器。清华大学和上海交通大学联合开发出一种新型音响系统。

    它使用超音波在空气中的一个特定点产生声音。允许用户非常精细地控制声音出现的位置和范围。换句话说,你可以准确地指定声音应该在哪个位置被听到,而其他地方则不会听到这个声音。

    工作原理:

    Meta-Speaker系统的工作原理基于声学非线性效应和超声波的交互。具体来说,系统使用两个或更多的高频声波(即超声波)从不同的方向发射。当这些超声波在空气中交叉或相遇时,由于声学非线性效应,它们会以特定的方式相互作用或“扭曲”。

    例如,如果你将两块石头扔进池塘里,就会产生两个涟漪。在这些波纹相交的地方,波浪的形状会发生变化,使它们变大或变小。

    这种相互作用产生了一个新的声波,其频率是原始超声波频率的差值。这个新产生的声波是在可听范围内的,因此人们可以听到它。更重要的是,这个可听声波是在超声波交叉的精确位置产生的,这意味着系统可以非常精确地控制声音在哪里产生。

    例如,如果你想在一个房间的特定位置听到某个声音或信息,系统可以通过精确地调整超声波的方向和频率,确保可听声音仅在那个特定位置产生。

    这种技术的一个关键优点是它能够在没有物理介质(如扬声器或其他声源)的情况下,在空气中的特定位置产生声音。这为各种应用,如室内导航、个性化信息传播等,提供了新的可能性。

    这样的系统需要精确的计算和校准,以确保超声波能够在预定的位置交叉,并且产生的可听声音具有所需的属性(如音量、音调等)。因此,它可能需要高度复杂的算法和硬件支持。

    技术步骤:

    1、数据预处理:首先,对收集到的音频数据进行预处理,以便后续的特征提取和模型训练。
    2、模型架构:Meta-Speaker使用了一种特定的神经网络架构,这种架构是为了适应边缘计算环境而特别设计的。
    3、元学习训练:通过元学习的方法,模型能够快速适应新的说话人,即使只有少量的数据也能进行有效的识别。
    4、边缘计算集成:由于模型是为边缘计算环境设计的,因此它是高效且轻量级的,适合在资源有限的设备上运行。
    paper.pdf
    2.7 MB
  2. Green Light:Google推出的一款新的AI软件,用于优化交通信号灯的工作效率。

    该软件通过分析Google地图上的驾驶数据,为城市提供交通信号灯时序的优化建议。初步结果显示,该AI软件每月为 3000 万辆汽车减少了 30% 的停车次数和 10% 的排放量。

    目前,这一项目已在4 大洲 12 个城市(包括雅加达、里约热内卢、汉堡和西雅图)进行了实施。

    Green Light的工作原理:

    1、理解交叉口:基于Google多年来对全球城市进行的地图绘制工作,该项目能够推断出现有的交通信号灯参数,包括周期长度、转换时间、绿灯分割(即通行权时间和顺序)、协调和传感器操作等。

    2、测量交通趋势:通过创建一个模型来理解交通如何流经交叉口,这有助于了解典型的交通模式,包括起停模式、红绿灯处的平均等待时间、相邻交叉口之间的协调(或缺乏协调)以及交通信号灯计划如何在一天中变化。

    3、为城市提供建议:使用AI,该项目识别可能需要调整的交通信号灯时序,并将这些调整作为可行的建议与城市共享。城市的交通工程师可以审查这些建议,并可以在短短5分钟内使用城市现有的政策和工具进行实施。

    4、分析影响:项目会测量为驾驶员节省了多少停车次数,以及这对交通模式有何影响。然后,使用行业标准模型来计算这些变化对气候的影响,并与合作城市共享这些信息。
    Media is too big
    VIEW IN TELEGRAM
  3. Bifrost是一个具有可插拔传输的点对点通信引擎:

    跨平台:支持网络浏览器、服务器、桌面、移动设备...
    高效:通过单个链路复用许多同时流。
    加密:识别、验证和加密对等体之间的每个链接。
    灵活:同时使用多种传输、协议。
    网格:支持通过电路到所需目标对等点的多跳路由。
    PubSub:具有可插入实现的发布/订阅通道。
    稳健:使用 Quic 在有损传输上实现可靠连接。

    Bifrost 使用ControllerBus控制器和指令来管理对等点、传输、路由和其他更高级别进程之间的链接,并具有广泛且灵活的配置。

    Bifrost 的设计围绕以下核心概念:

    对等点:具有密钥对的可路由进程或设备。
    传输:一种可以与其他对等点创建链接的协议。
    链接:两个对等点之间通过传输的连接。
    Stream:具有协议类型的两个 Peer 之间的数据通道。
    RPC:请求/回复和双向流远程调用。
    PubSub:至少一次将消息传递到指定主题。
    与网络、pubsub 和 RPC 库集成,例如libp2pnoisedrpcstarpcnats

    网络模拟器、测试床和进程内传输可用于将端到端测试编写为 Go 单元测试。模拟传输使用与真实传输相同的代码,并且对于应用程序代码来说也是相同的。

    http包提供了一个http服务器和一种将 http 处理程序附加到控制器总线并使用它们来服务请求的机制。还有一个在总线上附加和查找 http 客户端的实现。

    EntityGraph通过基于图形的互连实体模型向可视化工具和仪器公开 Bifrost 的内部状态表示。

    将每个组件配置为独立控制器可以轻松使应用程序代码适应不同的操作环境和协议。
  4. LLM Sherpa:提供开发者 API 以加速大型语言模型 (LLM) 项目,LayoutPDFReader 可以解决 PDF 解析中的布局问题,包括章节、段落、链接、表格等信息的提取,使用 LLM Sherpa 需要使用免费的开放 API 服务器,不支持 OCR,仅支持带有文本层的 PDF
  5. 统一、开放、可扩展的框架,适用于基于LLM的应用模式,包括检索增强生成 (RAG)。该项目提供了一套全面的工具,任何人都可以使用它来快速构建基于 LLM 的工业级企业应用。

    llmware | #框架
  6. OpenAdapt: 一个开源工具,旨在实现基于 Transformers 的 AI-First 过程自动化,将 Foundation Models(如 GPT-4 和 ACT-1)连接到 GUIs,OpenAdapt 可以记录屏幕截图和用户输入,可视化用户输入和记录,将它们转换为标记格式,并生成合成输入以完成任务
  7. Golden Concept 推出「亿万富翁的数码产品」

    瑞典奢侈品公司 Golden Concept 近日针对苹果新品更新了其定制产品线,并将 Apple Watch Ultra 2、iPhone 15 Pro Max、AirPods Max 以及一款 Royal Iced Edition 腕表产品组成了一套名为「亿万富翁的数码产品」套装礼盒。

    根据 Golden Concept 的介绍,整套产品在改装时共使用了总重 113 克拉,共计 7586 颗钻石作为点缀,而产品外壳则更换为了铂金材质。套装中的「Royal Iced Edition」腕表与 Apple Watch Ultra 2 尺寸相仿,专为不愿意佩戴智能手表的用户打造。整套产品售价 25 万美元,Golden Concept 官网介绍可全球包邮送达。
  8. 继 CodeLlama 开源之后,北大等机构正式开源了性能更强的代码基座大模型 CodeShell-7B 和代码助手 CodeShell-Chat。不仅如此,团队还把方便易用的 IDE 插件也开源了!

    今天,北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行 AI 实验室,正式开源 70 亿参数的代码大模型 CodeShell,成为同等规模最强代码基座。

    与此同时,团队将软件开发代码助手的完整解决方案全部开源。

    CodeShell 模型和插件的相关代码已经在 Github 发布,并严格遵循 Apache 2.0 开源协议,模型在 HuggingFace 平台发布,支持商用。

    CodeShell 代码 | CodeShell 基座模型 | 代码助手 VSCode 插件 | 原文
  9. Feng My Shui —— SD、MJ 多引擎文生图平台

    该网站支持选择 Stabe Diffusion XL、Midjourney 生成图片,未来还会支持 Dreambooth XL、Dall-E 3。能多引擎混合使用,比如将 Midjourney 的图立马用 Stabe Diffusion XL 做二次加工。
  10. IT之家 10 月 20 日消息,Excel 产品经理 Chirag Fifadra 近日发布博文,改善了去年引入的自动数据转换设置,目前已经向 Windows 和 macOS 平台用户开放。

    用户可以在 Excel 应用中打开“文件”>“选项”>“数据”>“自动数据转换”(Automatic Data Conversion),用户还可以继续禁用一个或多个自动转换选项。

    自动转换特性如下:
    1.清除文本格式中导致数值变为 0 的内容,并转换为数字格式。
    2.将数值数据截断为 15 位精度,并转换为可以以科学记数法显示的数字。
    3.将字母“E”周围的数字数据转换为以科学记数法显示的数字。
    4.将连续的字母和数字字符串转换为日期。

    目前该功能存在一个已知问题,因为在宏执行期间禁用转换将不起作用。目前还没有关于何时或是否会解决这个问题的消息。
  11. 大规模检索增强生成 - 构建用于同步和摄取数十亿文本嵌入的分布式系统。| blog

    文章详细介绍了Neum AI的一些技术和架构细节——Neum AI 是一个用于大规模嵌入管理、优化和同步的数据平台,本质上有助于大规模 RAG。

    RAG 通过以“自然方式”执行搜索来帮助快速查找数据,并使用该信息/知识为需要此类信息的更准确的人工智能应用程序提供支持。这是许多人在构建准确且最新的人工智能应用程序时采用的最新方法。