Skip to main content

黑洞资源笔记

  1. OSRD-开源铁路设计助手:铁路基础设施设计、容量分析、时刻表编排和仿真的开源网络应用,致力于铁路行业的创新与优化,提供高效、灵活的设计和分析工具
  2. Nerve Agent:利用任意大型语言模型(LLM)创建具有状态的智能代理,无需编写代码即可实现复杂任务的自动化执行,提供规划、记忆保存或回忆等功能框架
  3. Gen-3 Alpha:视频生成技术的新前沿,实现高保真度、可控性视频生成

    - 与视频和图像联合训练,支持从文字到视频、从图像到视频以及从文字到图像等工具,同时保留运动笔刷、高级相机控制、导演模式等控制模式。
    - 引入了一系列安全保障措施,包括内部视觉审查系统和C2PA来源标准。
    - 训练数据包含描述性细致和时间密集的描述,支持场景元素的富有想象力的过渡和精确的关键帧设置。
    - 表现出色的生成式真人角色,可以展示广泛的动作、手势和情绪,解锁新的叙事方式。
    - 由跨学科团队的科研人员、工程师和艺术家合作训练,旨在解释各种风格和电影术语。
    - 与主要娱乐和媒体组织合作,为Gen-3创建定制版本,允许更具风格的控制和一致的字符,达到特定的艺术和叙事要求。
    - 所有示例视频均完全由Gen-3 Alpha生成,无任何修改。
    - Gen-3 Alpha代表了高保真、可控视频生成的新前沿。它为艺术家提供了强大的新工具,为多种行业带来自定义解决方案的可能性。
  4. Generating audio for video:DeepMind视频音频生成技术,为无声视频创造同步音轨的创新工具,结合视频像素和自然语言提示生成丰富的音景

    - DeepMind研发了视频到音频(V2A)技术,可以利用视频像素和文本提示生成与视频同步的丰富音轨。
    - V2A可与像Veo这样的视频生成模型配合使用,为视频添加戏剧性配乐、逼真音效或与视频角色和语气匹配的对话。
    - V2A也可以为各类传统镜头生成音轨,如档案素材、无声电影等,拓宽创作空间。
    - V2A支持无限生成音轨,允许定义正向和负向提示来指导生成所需的音频。
    - V2A使用基于扩散的方法,先编码视觉输入,然后模型逐步从随机噪声中提炼音频。这个过程同时利用视觉输入和文本提示进行指导。
    - 为提高音频质量,训练中加入了AI生成的含音频详细描述和语音转录的注释信息。
    - V2A可理解原始像素,添加文本提示是可选的。它也无需人工调整生成音频与视频的对齐。
    - 当前局限包括视频失真可影响音频质量,语音同步存在待改进之处。
    - DeepMind将采取负责任的方式开发和部署V2A,正在与顶级创作者合作改进技术,并加入合成识别工具SynthID以防范技术误用。
    - V2A正在进行安全评估,初始结果显示它是使生成视频栩栩如生的有前景技术。
  5. DeepSeek-Coder-V2-Instruct:开源的专家混合模型,性能媲美GPT4-Turbo,专为代码特定任务优化,支持多源高质量语料库预训练,显著提升编程和数学推理能力,支持338种编程语言,扩展上下文长度至128K
  6. Copybook Generator:多用户需求的练字本生成工具,提供中文、英文及笔控练习等多种练字本类型,支持个性化定制,满足不同年龄和学习阶段用户的书写练习需求 | #工具 #生成器

    主要特点
    类型多样
    ■ 汉字练习字帖:适用于汉字书写练习,帮助用户掌握汉字的正确书写方法。
    ■ 汉字笔画练习字帖:提供汉字的详细笔顺,帮助用户了解每个字的正确书写顺序,提高书写准确率。
    ■ 字母练习字帖:适用于英文书写练习,帮助用户提高英文字母书写能力。
    ■ 控笔练习字帖:专为书写初学者设计,帮助用户练习握笔姿势和书写压力,增强书写控制力。

    定制选项
    ■ 字体和网格:选择不同的字体和网格样式,满足不同的书写练习需求。
    ■ 大小:调整字帖的字体大小,以适应不同年龄段和学习阶段的用户。
    ■ 笔顺:提供汉字的笔顺,帮助用户了解每个汉字的正确书写顺序。
    ■ 颜色:选择字帖字体的颜色,为练习增添乐趣和视觉效果。

    适合谁?
    ■ 学龄儿童:帮助学龄儿童练习书写,提高书写汉字和英文字母的能力。
    ■ 书法爱好者:提供专业的字帖模板,帮助书法爱好者练习临摹。
    ■ 教育工作者:为教师提供教学工具,方便学生练习书写。
    ■ 书写初学者:通过控笔练习字帖,帮助初学者掌握正确的握笔姿势和书写压力。