Awesome-Vison2Audio:视频转音频生成的资源库,为视频创作者和开发者提供一站式解决方案。

汇集了从2016年到2024年的前沿研究成果,涵盖100+篇相关论文;提供丰富的开源代码和在线演示,助力快速上手;涵盖音乐、音效、语音等多种音频生成场景,满足多样化需求
Awesome-Multimodal-Chain-of-Thought:一站式多模态思维链研究资源库。

汇集多模态思维链领域前沿论文与代码库;涵盖多种模态数据融合技术,助力复杂问题解决;提供丰富的研究思路与实践范例,推动多模态AI创新
Xeol:扫描容器镜像、文件系统和SBOM中的过期(EOL)软件和依赖项,提前发现安全风险。

支持多种扫描源,包括Docker、Podman、SBOM等;自动更新数据库,确保EOL信息实时准确;提供CLI工具,集成简单,适合CI/CD流程
为数据库交互打造的开源GenAI工具箱,让开发者轻松构建与数据库交互的生成式AI应用。

简化开发流程,集成工具仅需不到10行代码;提供连接池、认证等最佳实践,性能提升显著;内置OpenTelemetry支持,实现端到端可观测性

Gen AI Toolbox for Databases | #工具
VoAPI:一个高颜值、高性能的AI模型接口管理与分发系统,专为个人学习设计,帮你轻松管理和分发AI模型接口。

支持多种AI模块,如对话、绘画、音乐等;低资源需求,1C1G服务器即可流畅运行;完善的运营机制,包括签到福利、邀请奖励等
超轻量级的前端交互框架,用极简代码实现高效动态页面更新。

代码极简,未压缩仅3268字节,压缩后仅1176字节;无需依赖,无构建步骤,直接引入即可使用;支持现代JavaScript特性,如异步函数和Fetch API

Fixi.js | #框架
Tidyplots:为科学论文打造整洁美观的图表。

简化复杂图表的创建流程,让科研绘图变得轻松;支持多种高级绘图功能,如堆叠条形图、小提琴图等;提供多种预设配色方案,满足不同学术场景需求
Z-Ant:让神经网络在微控制器上轻松部署和优化。

跨平台支持,适配ARM Cortex-M、RISC-V等多种架构;优化性能,支持量化、剪枝和硬件加速;高效内存管理,内存使用优化至极致
simple_GRPO:一个简单的 GRPO(Generative Reinforcement Learning for Policy Optimization)实现,旨在复现类似 r1 的大型语言模型(LLM)思维过程。

仅200行代码,依赖极少,快速上手;分离式参考模型,可在不同GPU上运行,节省显存;1小时内完成训练,快速观察到模型的“顿悟时刻”
Open-R1-Video:为视频理解任务引入R1范式,开源训练代码和数据,助力多模态模型的高效训练

仅用视频、查询和答案即可训练,无需额外标注;使用GRPO训练,显著提升模型推理能力;开源数据集包含4K视频,适配多种硬件环境
Frames of Mind: Animating R1's Thoughts:旨在通过将 R1 的思考链转换为文本,然后使用 OpenAI API 将文本转换为嵌入,并通过 t-SNE 序列绘制这些嵌入,来可视化 R1 的思考过程。

利用t-SNE技术将文本嵌入转化为动态图表,直观呈现AI的“思考路径”;提供连续思考步骤的距离分析,精准捕捉思维跳跃;支持多种问题类型的可视化,帮助理解AI的决策逻辑
为学术项目打造的优雅网页模板,用React和UIKit搭建,支持Markdown和KaTeX公式,轻松搞定学术项目展示。

仅需一个`template.yaml`文件,配置轻松搞定;自动部署到GitHub Pages,零配置;支持自定义主题,适配多种学术风格

Academic Project Page Template | #模板
从任何文本中提取知识图谱的AI工具

支持多种输入格式,包括纯文本和对话消息;自动分块处理长文本,支持高达5000字符的分块;聚类相似实体和关系,让知识图谱更简洁易懂

kg-gen | #工具
Lisa:一个用现代Common Lisp编写的高质量专家系统外壳,为复杂问题提供高效推理引擎。

基于Rete算法,解决多对多匹配难题,效率极高;支持多种Common Lisp实现,如SBCL、LispWorks等;近期完成代码优化,性能大幅提升
Awesome-Robotics-Diffusion:机器人学习领域的扩散模型精选资源库。

汇集了40多篇前沿的机器人学习与扩散模型结合的学术论文;涵盖多种机器人任务,如操作、导航、规划等;提供丰富的代码和数据资源,助力研究和开发
Back to Top