Skip to main content

黑洞资源笔记

  1. Metriport:开源通用医疗数据API

    使用Metriport很简单,只需执行以下步骤:
    1.创建开发者帐户。
    2.生成 API 密钥。
    3.在服务器上设置 Metriport 客户端。
    4.链接到应用程序中的 Metriport Connect 微件。
    5.访问用户的健康数据

    文档 | 官网 | Github | #API
  2. 自动生成视频字幕并进行翻译,用语音合成实现配音,再利用字幕时间实现音画同步

    工作原理
    如果已经有视频的人造 SRT 字幕文件,可:

    1.使用谷歌云自动翻译文本,并创建新的翻译SRT文件
    2.创建已翻译文本的文本到语音转换音频剪辑(使用更逼真的神经语音)
    3.使用字幕行的计时来计算每个语音音频剪辑的正确持续时间
    4.拉伸或缩小翻译后的音频剪辑,使其长度与原始语音完全相同,并插入音频中的同一点。因此,翻译后的语音将与原始视频保持完全同步。
    5.可选(默认打开):您可以使用在第一次传递期间计算的正确语速,而不是拉伸音频剪辑,而是通过 API 合成每个剪辑。这大大提高了音频质量。

    其他主要功能
    1.创建 SRT 字幕文件的翻译版本
    2.按顺序批量处理多种语言
    3.用于保存翻译、合成和语言设置以供重复使用的配置文件
    4.包含用于将所有语言音轨添加到视频文件的脚本,能够将音效轨道合并到每个语言轨道中
    5.包含用于将 YouTube 视频标题和说明翻译成多种语言的脚本

    Auto-Synced-Translated-Dubs | 示例Wiki | 计划的功能 | Google Cloud 项目设置说明 | Microsoft Azure 安装说明
  3. Mac上的App图标改换工具

    使用:前往GitHub的Release界面,下载最新版App,将App移动到应用程序文件夹。

    获得 query api (可选择):打开Safari,打开https://macosicons.com/#/ ,搜索任意图标,打开开发者工具,选择网络标签栏,搜索 algolianet,复制链接类似于 p1txh7zfb3-3.algolianet.com,打开IconChanger的设置,输入链接。

    关于系统App:目前无法更改系统应用程序的图标。由于 SIP,用户或 root 无法向此应用写入内容。而Bridge App的想法需要修改一下 Info.plist,所以是行不通的。

    IconChanger | #工具
  4. 用Python编写的Discord机器人示例,它使用完成API与模型进行对话,并使用审核API过滤消息。

    此存储库不接受拉取请求。如果要添加或更改功能,请分叉此存储库。

    特征:
    /chat启动一个公共线程,参数是传递给机器人的第一条用户消息message;
    该模型将为以 开头的任何线程中的每个用户消息生成回复/chat;
    对于每个请求,整个线程都将传递给模型,因此模型将记住线程中以前的消息;
    当达到上下文限制或线程中达到最大消息计数时,机器人将关闭线程;
    可通过修改来自定义机器人指令config.yaml;
    可更改模型,硬编码值为text-davinci-003

    gpt-discord-bot
  5. 全新的轻量Javascript游戏引擎

    melonJS 2 是 melonJS 游戏引擎的现代版本。它几乎完全使用 ES6 类、继承和语义进行了重建,并使用 Rollup 进行捆绑以提供现代功能,例如转译和 tree-shaking。

    melonJS是开源的,根据MIT License获得许可,并在新加坡 AltByte 的一小群爱好者的帮助下积极开发和维护。

    注意:将现有项目迁移到 melonJS 2(版本 10.0 及更高版本)肯定会破坏你的游戏(ES6 语义,不再有 Jay 继承,nodeJS 事件发射器,并且不向后兼容已弃用的遗留 API),你可能想先阅读这个关于升级到 melonJS 2的分步指南。

    melonJS 2 | 分布指南 | #指南 #Javascript #游戏
  6. GitHub 与微信达成合作 | 原文

    微软 GitHub 官方于 12 月 20 日发布公报,宣布 Github 和腾讯微信达成合作,帮助保护所有公共仓库和私有仓库的共同用户。GitHub 密钥扫描会通过搜索存储库中的已知类型的密钥来保护用户。通过识别和标记这些密钥,有助于防止数据泄露和欺诈。腾讯微信令牌则允许用户验证微信公众号和小程序开发者,获取业务应用的敏感信息,并可用于验证商家身份。GitHub 会将在公共仓库中找到的访问令牌转发给微信,微信将通知受影响的用户。微信鼓励用户删除 GitHub 上泄露的 API token,并在微信支付商家平台或微信公众号平台上创建新 token。
  7. 韩国最大游戏开发商Nexon宣布与腾讯合作

    Nexon Town 是一个虚拟社区,用户可以在其中使用 Nexon 在线游戏(如《洛奇》、《冒险岛》、《泡泡堂》)中的物品和角色进行互动。用户可以在虚拟会议厅、教室和广场中举办在线活动,并交换 PDF 或视频等数字文件。用户还可以装饰自己的空间,例如虚拟房屋。
  8. 微软发现苹果 macOS 漏洞,可植入恶意软件

    微软于今年 7 月发现了一个 macOS 漏洞,可以绕过 Gatekeeper 安全机制执行恶意软件。微软将发现的这个 macOS 漏洞称之为“Achilles”,并通过“Coordinated Vulnerability Disclosure”将其告知给了苹果公司。该漏洞允许攻击者绕过苹果的 Gatekeeper 安全机制,在 Mac 设备上植入任意恶意软件。

    苹果公司在收到微软的报告之后,在本月 13 日发布的 macOS 13(Ventura)、macOS 12.6.2(Monterey)和 macOS 1.7.2(Big Sur)更新中修复了这个漏洞。
  9. 强制时间对齐的时间戳精确版Whisper语音识别 | WhisperX

    该存储库通过强制使用基于音素的ASR模型(例如wav2vec2.0)来优化openAI的Whisper模型的时间戳,多语言用例。

    Whisper是由OpenAI开发的ASR模型,在大型的各种音频数据集上进行训练。虽然它确实会生成高度准确的听录,但相应的时间戳位于话语级别,而不是每个单词,并且可能不准确几秒钟。

    基于音素的 ASR一套经过微调的模型,用于识别区分一个单词和另一个单词的最小语音单元,例如“tap”中的元素p。一个流行的示例模型是wav2vec2.0。

    强制对齐是指将正字转录与录音对齐以自动生成电话级分段的过程。
  10. 匿名口令分享文本,文件,像拿快递一样取文件

    主要特色
    轻量简洁:Fastapi+Sqlite3+Vue2+ElementUI
    轻松上传:复制粘贴,拖拽选择
    多种类型:文本,文件
    防止爆破:错误次数限制
    防止滥用:IP限制上传次数
    口令分享:随机口令,存取文件,自定义次数以及有效期
    匿名分享:无需注册,无需登录
    管理面板:查看所有文件,删除文件
    一键部署:docker一键部署

    FileCodeBox | #工具
  11. 基于Arxiv官方API与Github Actions相关服务,提供Arxiv的定制化服务,使用者可以通过配置相关文件,从Arxiv每日发布的最新研究成果中,实现个性化轻松地阅览属于自己的Arxiv网站

    基本功能:
    跟踪指定领域的最新成果
    缓存指定时段的文章信息

    特色功能:
    快速聚焦到文章标题中的指定关键字
    方便注意到文章作者中的指定学者
    及时了解到相关知名会议、期刊的学术文章

    MyArxiv | #科研
  12. Linux上的实时音频字幕桌面应用

    Live Captions 是一个为 Linux 桌面提供实时字幕的应用程序。目前仅支持英语。其他语言可能会产生乱码或错误的语音翻译。

    特征:
    简单的界面
    本地字幕桌面/麦克风音频,音频永远不会发送到任何地方
    不依赖任何专有服务/库
    调整字体、字体大小和文本大小写
    可选的令牌级置信度文本淡化
    运行它需要一个可以执行实时字幕的相当不错的 CPU,特别是如果您想在运行实时字幕的同时执行其他任务(例如视频解码)。它已经过测试:

    英特尔 i7-2670QM (2011)
    英特尔 i5-8265U (2018)
    AMD 锐龙 5 1600 (2017)
    不需要或不使用 GPU。

    LiveCaptions | #字幕 #Linux