Skip to main content

黑洞资源笔记

  1. 一个视频翻译工具,可将一种语言的视频翻译为另一种语言和配音的视频。 语音识别基于 openai-whisper 离线模型、文字翻译使用google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,无需购买任何商业接口,也无需付费

    pyvideotrans | #工具
  2. 机器学习和深度学习应避免的7种错误 | link | #经验

    1.使用低质量数据——缺失数据、噪音数据、不具代表性的数据都会降低模型性能。
    2.忽略离群值——离群数据点会对模型产生较大影响,需要妥善处理。
    3.数据集太大或太小——数据集需要适中且高质量,过大或过小会导致过拟合或欠拟合。
    4.使用性能不足的硬件——深度学习需要高性能计算资源,使用老旧系统会限制性能。
    5.集成错误——需要谨慎地将深度学习技术集成到旧系统中。
    6.重复使用单一模型——应该训练和评估多个模型,获得更全面的结果。
    7.首个模型就想要最佳效果——不同模型各有擅长,需要迭代和变化来获得鲁棒结果。
  3. LLMFarm:iOS/MacOS上的离线大语言模型App(使用GGML库),基于Georgi Gerganov的ggml和llama.cpp。可以使用某些参数加载不同的 LLM。
  4. Flappy 是一款可投入生产的语言模型 (LLM) 应用程序/代理 SDK,旨在简化项目中的 AI 集成。它是一种易于使用、普遍兼容且可立即投入生产的解决方案,可为开发人员带来人工智能的强大功能,无论他们首选的编程语言是什么。

    主要特征
    易于使用:Flappy 的设计与 CRUD 应用程序开发一样用户友好,最大限度地缩短了刚接触 AI 的开发人员的学习曲线。

    生产就绪:除了研究之外,Flappy 是一个强大的 SDK,可以平衡成本效率和沙箱安全性,为商业环境提供稳定的平台。

    与语言无关:Flappy 可以与任何编程语言无缝集成,除非您的应用程序明确要求,否则无需使用 Python。
  5. 一个帮助你集成人工智能和机器学习技术到虚幻引擎的 UE 插件,功能包括动作捕捉、面部表情捕捉、语音合成 (TTS)、语音识别 (ASR) 等,所有功能都是实时、离线、低延迟且易于使用。

    MediaPipe4U | #插件
  6. FFL:类似CSS的语言,用于为LaTeX类型的数学公式添加样式,允许用户对数学公式进行格式设置,比如颜色、字体大小等
  7. Remembrall:一个API平台,它能为基于LLM的应用提供长期记忆能力,允许开发者只需两行代码即可将上下文信息插入到LLM调用中,这样LLM就可以利用用户聊天记录和相关文档进行回应 | #API
  8. OpenSign 是一个开源文档电子签名解决方案,旨在为 DocuSign、PandaDoc、SignNow、Adobe Sign、Smartwaiver、SignRequest、HelloSign 和 Zoho Sign 等商业平台提供安全、可靠且免费的替代方案。

    特性:
    1、安全签名:利用最先进的加密算法来确保文档的安全性和完整性。
    2、用户友好的界面:设计时考虑到可用性,使技术和非技术用户都能轻松使用。
    3、多平台支持:兼容各种浏览器和设备。
    4、邀请和协作用户:将团队中的多人带入签名流程,所有这些都在你自己的基础设施内进行。
    5、安全:允许使用 “OpenSigDrive” 轻松、安全和无缝地组织文档。
    6、审计跟踪:保留与文档签名过程相关的所有活动的详细日志,包括 IP 地址和访问时间。
    7、完成证书:所有参与者签署文件后立即生成安全完成证书。
    8、API 支持:提供强大的 API,用于集成到其他软件和服务中。