Skip to main content

黑洞资源笔记

  1. MobileNetV4 - Universal Models for the Mobile Ecosystem

    通过巧妙设计的模块、注意力机制和NAS方法,使模型在移动端各硬件上都能高效部署。
  2. SRGS: Super-Resolution 3D Gaussian Splatting

    通过高分辨率密集化和纹理学习,提出一种只需低分辨率多视图输入就可以实现高质量高分辨率小场景新视图合成的方法SRGS。
  3. Pile-T5:更好的通用预训练语言模型

    Pile-T5通过在Pile数据集上预训练T5模型,并使用LLAMA分词器,改进了原始T5的编码能力。

    Pile-T5总体上明显优于原始T5v1.1模型,尤其在代码任务上的提升更大。这主要得益于Pile中包含代码数据以及LLAMA分词器包含编程常用字符。

    在多个下游任务的微调中,Pile-T5不同规模的模型表现优异,如在SuperGLUE、CodeXGLUE、MMLU和BigBench Hard上的结果。

    尽管与专门微调的Flan-T5相比略逊色,但Pile-T5仍优于T5v1.1,表明其预训练质量更高,更适合多任务微调。

    公开了Pile-T5模型在不同训练步长的中间检查点,这有利于模型演化和解释性研究。

    Pile-T5 Large模型在某些任务上的表现不佳,可能存在bug,用户需谨慎使用。
  4. Mistral AI发布了新的开源模型Mixtral 8x22B。该模型以39B活跃参数实现141B参数规模,极大提升了模型规模与成本效率。

    Mixtral 8x22B支持英语、法语、意大利语、德语和西班牙语,并具有强大的数学和编程能力。其支持函数调用,可大规模实现应用开发和技术栈现代化。

    Mistral AI坚信开源的力量,Mixtral 8x22B以最宽松的Apache 2.0许可证发布。

    Mistral AIModels追求卓越的成本效率。Mixtral 8x22B相较同规模模型,提供最佳的性能价格比。其稀疏激活可提升速度。

    Mixtral 8x22B在推理、知识、多语言、编程、数学等多个基准测试上,表现优于其他开源模型。后续会发布指导版本,数学表现更佳。
  5. 简约且好用的双语对照翻译插件和油猴脚本 kiss-translator | #工具 #插件

    具有如下特性:

    - 支持常见浏览器,如 Chrome、Edge、Firefox 等;
    - 支持多种翻译服务,如 Google、DeepL、OpenAI、Gemini 等;
    - 支持多种常见翻译场景,如网页双语对照翻译、输入框翻译、YouTube 字幕翻译等;
    - 支持跨客户端数据同步,可使用 KISS-Worker 或 WebDAV;
    - 支持自定义翻译规则,规则订阅/分享,自定义专业术语;
    - 支持自定义译文样式以及自定义快捷键;
    - 完全开源且可免费使用。
    GitHub_fishjar_kiss_translator_A_simple,_open_source_bilingual_translation.webm
    1.6 MB
  6. Tango:TypeScript 重新实现的 ADB(Android Debugging Bridge)客户端,可以在基于 Chromium 的浏览器(包括 Chrome for Android)、Node.js 和 Electron 中运行
  7. 基于 Node.js 的工具,可以将 URL 转换为 LLM 可以理解的输入,支持标准、流式和 JSON 模式。使用该工具可以提高 LLM 或 RAG(Retrieval-Augmented Generation)系统的输出质量

    Reader | #工具
  8. Nezha:基于同步时钟的可部署和高性能一致性算法,提供了多种性能优化,如高性能库和数据结构的使用、管道优化等
  9. Embed-Photos:基于 MLX 和 CLIP 模型的简单而强大的相似图像搜索网页应用

    🌟特点
    🚀 使用 CLIP 模型快速高效的图像搜索
    💻 仅适用于 Apple Silicon (MLX)
    💾 使用 SQLite 和 Chroma 持久存储图像嵌入
    🌐 Web 界面,方便交互和探索
    🔒 安全的图像服务和处理
    📊 用于性能分析的日志记录和监控
    🔧 使用环境变量的可配置设置