Skip to main content

黑洞资源笔记

  1. The Information 4月27号的一份新报告深入探讨了苹果 Siri 和人工智能团队内部明显的混乱。据报道,“组织功能障碍和缺乏雄心”一直困扰着 Apple 改进 Siri 和支持它的后端技术的努力。

    这种功能障碍导致苹果越来越落后于 OpenAI、微软和谷歌等竞争对手,导致一些苹果员工质疑未来。

    在 Apple 内部,这份报告表明“Siri 仍然被员工广泛嘲笑”。据报道,苹果 Reality Pro 耳机的开发团队曾一度对 Siri 感到非常沮丧,以至于考虑“构建替代方法”以通过语音技术控制耳机。

    Siri 面临的瓶颈之一是 Apple 的“高层管理人员”担心 Siri 在其响应中出现重大失误。正如我们在 ChatGPT 中看到的那样,这可能会导致令人尴尬的头条新闻和对平台的整体负面报道。

    The Information的完整报告非常值得一读。它全面介绍了 Siri 的当前状态,以及 Apple 工程师如何努力改进该平台,尽管存在一些包袱和内部冲突。
  2. 许多公共 Salesforce 网站正在泄露私人数据

    KrebsOnSecurity 获悉,数量惊人的组织(包括银行和医疗保健提供商)正在从其公共Salesforce Community网站泄露私人和敏感信息。数据泄露全部源于 Salesforce Community 中的错误配置,该错误配置允许未经身份验证的用户访问仅应在登录后可用的记录。

    Salesforce Community 是一种广泛使用的基于云的软件产品,使组织能够轻松快速地创建网站。客户可以通过两种方式访问​​ Salesforce 社区网站:经过身份验证的访问(需要登录)和来宾用户访问(无需登录)。来宾访问功能允许未经身份验证的用户无需登录即可查看特定内容和资源。

    但是,有时 Salesforce 管理员会错误地授予来宾用户访问内部资源的权限,这会导致未经授权的用户访问组织的私人信息并导致潜在的数据泄露。| 详文
  3. Windmill:将脚本转换为工作流和 UI 的开源开发者平台。

    开源开发者基础架构,用于内部工具。自主托管的选择,可以替代Airplane、Pipedream、Superblocks和简化版Temporal,具备自动生成UI的功能和自定义UI,用于触发工作流和脚本作为内部应用。脚本将转换为UI和无代码模块,无代码模块可以组合成非常丰富的流程,并且脚本和流程可以从用低代码构建器制作的内部UI触发。支持的脚本语言包括:Python、Typescript、Go、Bash、SQL。
  4. 大语言模型(LLM)微调技术笔记 | 传送门 | #笔记

    在预训练后,大模型可以获得解决各种任务的通用能力。然而,越来越多的研究表明,大语言模型的能力可以根据特定目标进一步调整。这就是微调技术,目前主要有两种微调大模型的方法
    1:指令微调,目标是增强(或解锁)大语言模型的能力。
    2:对齐微调,目标是将大语言模型的行为与人类的价值观或偏好对齐。
  5. Google最新发布PaLM 2,一种新的语言模型,具有更好的多语言和推理能力,同时比其前身PaLM更节省计算资源。

    PaLM 2综合了多项研究进展,包括计算最优的模型和数据规模、更多样化和多语言的数据集、以及更有效的模型架构和目标函数。

    PaLM 2在多种任务和能力上达到了最先进的性能,包括语言水平考试、分类和问答、推理、编程、翻译和自然语言生成等。PaLM 2还展示了强大的多语言能力,能够处理数百种语言,并在不同语言之间进行翻译和解释。PaLM 2还考虑了负责任的使用问题,包括推理时控制毒性、减少记忆化、评估潜在的伤害和偏见等。
    palm2techreport.pdf
    4.8 MB
  6. 轻量Python框架,提供用于创建和渲染Blender场景的高级API。框架主要关注3D计算机视觉可视化,简化了对Blender的某些功能和对象的使用。

    主要特点:

    1.简单的界面: Blendify 提供了一个用户友好的界面来执行常见的可视化任务,而无需深入研究复杂的 Blender API。
    2.易于集成: Blendify 与开发脚本无缝集成,实现常用例程和功能:
    点云、网格和基元的原生支持;
    支持逐顶点颜色和纹理;
    带有阴影捕捉器对象的高级阴影;
    具有平滑摄像机轨迹的视频渲染;
    支持常见相机型号;
    导入和导出 .blend 文件以与 Blender 进行更深入的集成。
    3.快速入门: Blendify 易于上手,不需要单独安装 Blender。你需要做的就是运行pip install blendify。

    Blendify | #框架
  7. ChatALL:可以同时与多个AI聊天机器人(如ChatGPT、Bing Chat、Bard、Alpaca、Vincuna、Claude、ChatGLM、MOSS、iFlytek Spark、ERNIE等)进行对话的工具。它可以并行发送提示给不同的AI机器人,帮助用户找到最好的回答
  8. 辅助生成:低延迟文本生成的新方向 | blog

    介绍一种新的解码方法来解决LLM文本生成的延迟问题,通过使用“辅助生成”,可以在通用硬件上将延迟降低多达10倍。
  9. AudioDec: 开源的高保真神经音频流编解码器,适用于48 kHz单声道语音,比特率为12.8 kbps。在GPU(约6毫秒)和CPU(约10毫秒)上具有非常低的解码延迟。通过高效的两阶段训练,可以在几个小时内为新应用训练编码器。
  10. AuditNLG是一个开源库,可以帮助降低与使用生成式 AI 系统进行语言相关的风险。它提供并聚合了用于检测和提高信任度的最先进技术,使过程简单且易于集成方法。

    该库支持三个方面的信任检测和改进:真实性、安全性和约束。它可用于确定输入到生成式 AI 模型或从生成式 AI 模型输出的文本是否存在任何信任问题,并提供输出替代方案和解释。

    Factualness:确定文本字符串是否与给定的知识来源事实一致,而不是基于幻觉。它还根据世界知识检查文本是否正确。
    Safety:确定文本字符串是否包含任何不安全的内容,包括但不限于毒性、仇恨言论、身份攻击、暴力、身体、性、亵渎、有偏见的语言和敏感话题。
    Constraint:确定文本字符串是否遵循人类提供的显式或隐式约束(例如做、不做、格式、样式、目标受众和信息约束)。
    PromptHelper and Explanation:该工具提示 LLM 自我完善和重写更好、更值得信赖的文本序列。它还解释了为什么样本被检测为非事实、不安全或未遵循约束。
  11. 具有聊天界面的上下文数据可视化工具,使用自然语言和GPT生成数据集的可视化,可以逐步编辑可视化结果,使其更加准确,无需重新输入整个复杂查询。

    特点包括:自然语言生成数据可视化、使用聊天上下文编辑可视化、允许用户根据预期修改图表、通过与可视化交互逐步探索数据、上传自己的CSV数据集进行可视化、保存可视化和聊天记录、允许用户使用可视化编辑器进行编辑,并根据用户的喜好生成更好的可视化。

    VizGPT | #可视化 #工具