Libredesk:开源的自托管客户支持桌面应用程序,提供单一二进制文件,支持多渠道对话管理、自动化规则、客户满意度调查、宏命令、组织管理、自动分配、服务水平协议管理、商业智能连接以及人工智能辅助的回复改写等功能。

多语言支持,覆盖全球客户;丰富的自动化功能,如智能分类和自动分配工单;高度可定制的权限设置,满足不同团队需求
腾讯混元Turbo S:(免费申请试用)腾讯推出了新一代的快思考模型混元 Turbo S,该模型在腾讯元宝上进行灰度上线,提供了快速响应能力,并在知识、数理、创作等方面表现出色。核心价值:大幅提升AI响应速度,降低部署成本。

首字时延降低44%,吐字速度提升一倍;知识、数理、创作多领域表现卓越;部署成本大幅下降,推动大模型应用普及
将自然语言提示转化为个性化排行榜的AI工具,用于评估大型语言模型(LLM)性能,能生成针对特定提示或提示集合的排行榜,以揭示用户和提示特定的模型表现变化。

提供基于提示的模型性能评估,精准捕捉模型优劣;实现任务特定的自动化评估,助力模型优化;支持OpenAI兼容路由,高效分配查询到最优模型

Prompt-to-Leaderboard(P2L)| #工具
一个全面评估机器人视觉语言模型(LVLMs)的基准测试工具,助力提升机器人在真实场景中的认知能力。

覆盖30个维度的具身认知能力评估;4324个问答对,数据丰富多样;引入ECEval系统,确保评估指标的公平性和合理性

ECBench | #工具
Self-rewarding-reasoning-LLM:训练能自我奖励推理的大型语言模型,让模型在推理过程中自主评估输出正确性,无需外部反馈

通过自我奖励机制,模型推理能力提升显著,最终准确率提升最高达14.2%;自我修正能力强大,能自动检测错误并优化输出;结合强化学习,性能超越依赖外部奖励模型的系统
开源SIEM工具,让日志分析变得轻松高效。

用SQL查询日志,分析速度飞快,秒级响应;支持多种云平台,如AWS、Azure、GCP,一站式搞定日志分析;社区驱动,丰富的预置检测和仪表盘,轻松上手

Turbot Tailpipe | #工具
Media is too big
VIEW IN TELEGRAM
Semaphore:开源CI/CD平台,助力团队快速、安全地交付软件

极速构建与部署,节省时间;支持多种云环境,无缝对接容器和Kubernetes;社区版完全免费,适合从个人开发者到大型团队
为LLM应用提供强大的评估工具 | OpenEvals | #工具

提供多种预建评估器,如正确性、简洁性和幻觉检测;支持Python和TypeScript,适配多种开发环境;集成LangSmith,方便实验跟踪和结果记录
OpenHomie:开源代码助力人形机器人远程操控,让复杂任务变得简单高效。

创新性地使用同构外骨骼驾驶舱,实现精准全身体操控;总成本仅0.5k美元,远低于传统动捕设备;支持多种人形机器人,拓展性强
LLMs-from-scratch-CN:从零构建大模型的中文翻译项目,助力中文学习者深入理解大语言模型的构建与实践

详细中文注释的Jupyter代码,快速上手;提供丰富的附加学习材料,拓展知识边界;适配国内学习习惯,优化翻译表达
AgenticMemory:为LLM Agent打造的新型动态记忆系统,助力Agent高效管理历史经验,提升任务处理能力。

基于Zettelkasten原则的动态记忆组织;智能索引与链接,实现记忆的高效检索;6大基础模型实验证明性能优于现有SOTA基线
Emblor:一个功能强大的标签输入组件,让开发者轻松实现高效、美观的多标签输入功能。

支持21种特性,包括自动补全、去重、排序等;高度可定制,满足多种开发需求;兼容主流前端框架,无缝集成
用Swift生成原生UI的调试菜单工具,让开发过程更轻松。

通过`@ Spice`属性包装器和`SpiceStore`协议,快速生成调试菜单;支持SwiftUI和UIKit生命周期,适配多种开发场景;提供丰富的UI组件,如开关、选择器、按钮等,满足多样化调试需求

Spices | #工具
高效、可扩展的强化学习训练框架,用于训练具有推理和搜索引擎调用能力的大型语言模型(LLM)。

基于veRL构建,支持3B规模的基础LLM;通过规则化奖励机制,让LLM自主学会推理和搜索;提供完整的训练流程和工具支持,助力研究和开发

Search-R1 | #框架
Ryan Hart 的LLM学习法:用 AI 助手 Grok 作为个人导师,实现超快速学习。| #经验

提供 8 种学习提示,涵盖从技能特定学习到资源整理的全方位方法;强调个性化学习计划,帮助用户高效掌握任何技能;结合实际案例和加速学习技巧,让学习事半功倍
Back to Top