Skip to main content

黑洞资源笔记

  1. PlayStation 5 开始降价,或为新品让路

    国内多渠道 PlayStation 官方旗舰店近日对 PlayStation 5 游戏主机开展了官方降价活动,目前数字版和光驱版均下调了 770 元的售价,目前购买入手的价格为 2729 元 与 3529 元。根据店内海报介绍,活动将持续至 5 月 19 日。

    此前有消息称 SONY 将于 9 月份推出采用可拆卸光驱的新款 PlayStation 5,并有可能在今年底推出全面增强的 PlayStation 5 Pro。根据多方消息报道,PlayStation 5 Pro 会搭载使用 5nm 工艺的 Zen4 CPU 与 RDNA3 架构的 GPU,将能更好的提供 120 FPS 或 4K 的游戏支持。
  2. IT之家 4 月 27 日消息,微软近日宣布了一个重大变化,即将其所有 Microsoft 365 应用和服务的域名统一为 cloud.microsoft,这些应用和服务包括 Office 应用、Teams、Outlook 等等。过去,用户访问这些产品和服务时,需要使用不同的域名,造成了混乱和不便。

    微软在博客文章中表示,这一变化将为用户带来以下好处:

    提升用户体验,减少登录提示、重定向和延迟,让用户在不同的应用之间更顺畅地切换。

    降低管理员的工作复杂度,减少需要允许访问的域名列表,从而提高租户的安全性,同时使用户能够访问他们需要完成工作的应用和服务。

    为所有客户和开发者打造一个更好、更紧密的 Microsoft 365 生态系统,通过简化开发和提高跨应用体验的性能。

    IT之家从官方博客获悉,微软之所以选择了“cloud”作为域名,因为它是一个“持久、可扩展、中立”的词语,能够涵盖将来可能使用它的各种在线服务。虽然今天的公告只涉及 Microsoft 365 应用和服务,但微软暗示了未来可能将 cloud.microsoft 域名扩展到其他在线服务。

    微软表示,目前只有“网络新服务(net-new services)”会使用 cloud.microsoft 域名。大多数情况下,客户无需对他们现有的 Microsoft 365 服务做任何改变。如果有任何现有的服务需要客户做一些调整,微软计划提前至少 30 天通知客户,以便他们采取相应的行动。 Microsoft.com 域名仍然会被微软用于“非产品体验”,如营销、支持和电子商务等。
  3. 潘多拉 Pandora,一个开源的 ChatGPT 命令行工具,可直接通过 access token 来访问网站功能。后端优化,绕过 Cloudflare,提升访问速度。

    主要用于解决以下问题:

    - 高峰期能绕过官方限制,继续使用;
    - 应答速度直逼 PLUS;
    - 官方故障的时候,它可能还是能跑;
    - 多模式:网页 / 命令行 / API,私有化部署;
    - 不会像官方那样无故断线、报错。

    使用该工具或许有账号封禁和 access token 泄密的风险,请自行判断是否使用,这里仅分享技术解决方案。

    访问doc/wiki.md获得详细指南

    wiki | repo | #工具
  4. 一个开源的文档内容高效检索 AI 工具:Semantra,与传统的文本匹配方式不同,它能够直接使用语义查询,提升检索效率。可选择多种语言模型,支持在本地离线部署运行,注重隐私安全。

    使用命令行即可快速处理本地的文本和 PDF 文件。在任务完成后,它会在本地搭建一个 Web 搜索页面,让你能在界面上对直接查询文档。

    Semantra 的设计目的是方便易用,可定制。适合需要在大量文档中进行精确搜索的个人或团体,例如新闻从业者、研究员、学生或教师等。主要作用是对存储在本地计算机上的文档(文本或 PDF 文件)进行操作,你可以选择处理单个或多个文档。

    该项目对文档的处理有两种方式:「内嵌模型」和调用「OpenAI API」。默认是用的 MPNet 语言模型。

    如果你电脑配置还过得去,或者想离线处理文档,可以优先选择下载大语言模型,这种方式可以最大程度保证你的隐私安全。

    如果想用 OpenAI API,项目也提供了相对应的方案,不过所产生的 Token 消耗,你需要自行承担。

    针对这两种方案,作者都在 GitHub 中给出了详细文档。

    Semantra | #工具
  5. 一篇名为《Scaling Transformer to 1M tokens and beyond with RMT》(Paper)最近在技术圈引发热议。有推友用chatgpt给这篇论文做了一个通俗易懂的总结。| 地址

    该论文提出一种名为 RMT 的新技术,或许可将 Transform 的 Token 上限扩展至 100 万,甚至更多。

    而目前最强的 GPT-4-32k,其 Token 上限也才 3.2 万,这就导致了它并不能很好的处理长文内容。像文档、书籍、代码这种大块内容,往往需要先对内容进行切割,分多次喂给 GPT,但 GPT 本身能理解的上下文内容有限,这就很容易导致结果偏离预期。

    如果未来 Token 的上限能够不断突破,将会创造出更多 AI 应用场景。包括之前所畅想的,训练一个无限接近自己人格的 AI 聊天机器人。
  6. 阿里云官宣,旗下产品将实施史上最大规模降价,其中核心产品的价格下调了 15% 至 50%,存储产品最高的降幅达到了 50%。比同行低 了10%-20%。

    在此次降价中,弹性计算第 7 代实例和倚天实例的价格下调了 15-20%,最新的存储 OSS 深度冷归档的价格甚至比冷归档降低了 50%。

    网络负载均衡 SLB 和 NAT 网关的价格都下调了 15%,而数据库 RDS 倚天版的价格最高下调了 40%。
  7. MagickPen:这个工具可以最大程度释放GPT-3的潜力 | #工具

    你可以轻易地生成ideas、博客、计划等等,而无需绞尽脑汁思考Prompt。还可以用于翻译、语法检测和代码修复,发挥无限可能。
  8. 桌面端AI语言练习应用,基于ChatGPT和Azure人工智能语言模型作为底层服务,目的是提供一个易于使用的语言练习平台,方便进行多语种的口语练习

    功能:
    多国语言口语练习,内置了英语,其他语言现在支持自定义
    智能语音合成(基于Azure TTS服务)
    智能对话功能(基于chatGPT服务)
    支持暗黑模式
    接入文字翻译功能
    支持用户自定义语种和AI人物
    支持用户配置自定义对话场景
    支持Azure openai api服务
    用户自定义配置Azure key

    使用方法
    设置OpenAI Key
    设置代理(非必须)
    选择喜欢的AI人物进行对话;
    与AI人物进行对话练习口语。

    下载:Mac Win | Polyglot
    Media is too big
    VIEW IN TELEGRAM
  9. 复旦大学发布了一个引发轰动的大语言模型:MOSS

    这是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
    example_moss_search.gif
    35.1 MB
  10. 基于 Electron 的开源 AI 助手,旨在打造极致的桌面端效能工具。

    它最初的目标是开发一款类似于苹果智能助手的智能悬浮窗,不占用桌面空间,不占用系统性能,可以通过全局热键快速访问,方便用户使用。借助ChatGPT技术,用户可以持续训练onepoint,以更高的精度(onpoint)生成和重构内容,从而提高效率。

    Onepoint目前支持VSCode、Pages、Microsoft Word、Email等多种编辑场景,以及Safari、Chrome等阅读场景,实现真正的全场景智能覆盖。

    onepoint | #工具
  11. Whisper JAX:这是一个对OpenAI开源的Whisper模型网页链接 的优化版本,它针对GPU和TPU做了优化,性能提升了70倍,最快1小时的音频15秒能完成转录!

    提速的关键:
    1. 批量处理
    Transformers 实现了一种批处理算法,其中单个音频样本被分成 30 秒的片段,然后分批转录这些块。这种批处理算法比 OpenAI(按顺序转录块)提供高达 7 倍的增益

    2. JAX优于PyTorch
    JAX 是一个用于高性能机器学习研究的自动微分库,通过即时 (JIT) 编译 Whisper,比PyTorch在 GPU 上获得了 2 倍的速度提升

    3. TPUs 优于 GPUs
    张量处理单元 (TPU) 是由 Google 设计的 ML 加速器, TPU 专为矩阵乘法而构建,与更通用的 GPU 相比具有显着优势。在 TPU v4-8 上运行 Whisper JAX 比在 NVIDIA A100 上快 5 倍!

    全部加在一起:批处理 7 倍 JAX 2 倍 TPU 5 倍速度增益 => 整体速度提升 70 倍

    paper | demo | repo