Skip to main content

黑洞资源笔记

  1. 一款中文的开源数据标记工具。

    目录前工具栏、多边形、标记点、标记线、分类、描述等图像标记标记能力,能够支持容器分组标记、扩展标记例分割、文本转写、转库线检测、关键点检测等计算机视觉任务现场,通过工具的自由组合即可自定义标记任务,支持COCO、MASK格式数据导出。

    场景:计算机视觉
    检测:车辆/车牌/行人/人脸/工业零件等检测场景。
    分类:检测物体分类、目标特征、是非判断等分类场景
    语义分割:人体分割、全景分割、可行驶区域分割、车辆分割等。
    文本转录:车牌、发票、保险单、标志等的文本检测和识别。
    轮廓检测:定位线条场景,如人体轮廓线、车道线等。
    关键点检测:定位场景,如人脸关键点、车辆关键点、道路边缘关键点等。

    LabelU | #工具
  2. CreatorDB:一个MIT公开课 6.830 数据库系统的讲解和实现项目,该项目实现了一个简单的关系型数据库SimpleDb 。

    SimpleDb 是一个 DBMS 数据库管理系统, 包含存储, 算子, 优化, 事务, 索引 等, 全方位介绍了如何从0实现一个 DBMS, 可以说, 这门课是学习 TIDB 等其他分布式数据库的前提。
  3. 借助AI来自动生成和翻译字幕

    先把视频放到Google Drive,然后从Google Colab上运行代码,并且在Colab加载整个Whisper模型,这样并不受API请求限制的影响,可以快速完成转录。语音转字幕后,再借助ChatGPT的API对字幕逐行翻译,最后再人工校对就好了。

    N46Whisper 是基于 Google Colab 的应用。开发初衷旨在提高乃木坂46(以及坂道系)字幕组的工作效率。但本应用也适于所有日语视频的字幕制作。此应用基于AI语音识别模型 Whisper,应用输出文件为ass或srt格式,内置指定字幕组的字幕格式,可直接导入 Aegisub 进行后续翻译及时间轴校正

    使用方法:
    点击这里在Google Colab中打开应用.
    上传要识别的文件并运行应用
    识别完成后ass文件会自动下载到本地.
  4. 适用于Mac的一款颜值颇高的 HTTP 调试工具:RapidAPI for Mac 现已免费。

    可以用它来编写 API 接口请求、完善 API 描述文档、测试服务器响应、生成客户端代码等工作,并支持多个团队成员实时协作。

    该工具还拥有丰富的插件市场,里面提供了多款实用插件,可进一步扩展工具功能。同时,它还支持 JSON Schema,可一键导入、生成兼容的 Swagger、RAML 和 API Blueprint 描述文件。

    主页 | 扩展 | 文档 | #工具 #API
  5. Stability AI (就是那个开源Stable Diffusion的公司)新开源了他们的大语言模型StableLM。

    目前发布的是StableLM-alpha 模型,有30亿参数和70亿参数两款。150亿参数和300亿参数的型号正在开发中。对中文的支持不怎么样。

    许可协议是CC BY-SA-4.0(可商用,但衍生品必须同样是使用该协议)。
  6. Vercel发布了一个免费的AI Playground,你可以对比测试多种AI模型。

    同时比较和调整AI语言模型:

    ◆ OpenAI
    ◆ AnthropicAI
    ◆ CohereAI
    ◆ Huggingface
    ◆ replicatehq
  7. Metafor是一个世界级的人工智能研究团队,致力于重新定义网络搜索

    该团队发布了一个产品,它是一个自然语言搜索引擎,可以方便的用自然语言检索网页、Twitter、YouTube、PDF等

    metaphor.systems
  8. HealthGPT是一个实验性的iOS应用,让用户可以使用自然语言与iPhone上的健康数据进行互动。支持查询睡眠、步数、活动能量、运动分钟、心率和体重。
  9. 昨天突然有大量乱七八糟的平台短信验证码持续性发过来,我知道这是隐私泄露了,信息被卖了。根本原因还是因为实名制。现在什么都得弄个实名,搞得隐私更透明了。