Skip to main content

黑洞资源笔记

  1. 教你从零开始构建类似 ChatGPT 的大语言模型。

    在 GitHub 上发现一本《Build a Large Language Model (From Scratch)》书籍。

    作者将带你从头开始构建一个类似 GPT 语言模型,这过程让你了解如何创建、训练和微调大型语言模型 (LLMs)!

    书籍主要分为 8 大章节,如下:

    第 1 章:了解大语言模型(LLM)解析
    第 2 章:介绍文本数据处理技巧
    第 3 章:通过编程实现注意力机制(Attention Mechanisms)
    第 4 章:从零开始实现类似 GPT 模型
    第 5 章:对未标注数据进行预训练
    第 6 章:针对文本分类的模型微调
    第 7 章:结合人类反馈进行模型微调
    第 8 章:在实践中使用大语言模型

    书籍前两章内容已出,剩下的会逐步放出。

    在线阅读 | 涉及源码
  2. Sketch2NeRF是一种多视角草图引导的文本到3D生成模型,能生成类似于多视角草图的高保真度3D对象,利用预训练2D扩散模型来优化神经辐射场(NeRF)表示的3D场景,提出一种新的同步生成和重构方法来有效优化NeRF。

    实验结果表明,Sketch2NeRF能在细粒度草图控制和文本提示的高保真度方面实现3D一致的内容。在草图相似性和文本对齐方面,该方法达到了最先进的性能水平。
  3. TaskingAI将 Firebase 的简单性带入AI 原生应用程序开发中。

    该平台支持使用来自不同提供商的各种LLM来创建类似 GPT 的多租户应用程序。它具有独特的模块化功能,例如推理、检索、助手和工具,无缝集成以增强开发过程。

    TaskingAI 的凝聚力设计确保了人工智能应用开发的高效、智能和用户友好的体验。

    主要特征:

    一体化 LLM 平台:通过统一的 API 访问数百个 AI 模型。
    直观的 UI 控制台:简化项目管理并允许控制台内工作流程测试。
    BaaS 启发的工作流程:将 AI 逻辑(服务器端)与产品开发(客户端)分开,提供从基于控制台的原型设计到使用 RESTful API 和客户端 SDK 的可扩展解决方案的清晰途径。
    可定制的集成:通过可定制的工具和先进的检索增强生成(RAG)系统增强法学硕士功能
    异步效率:利用Python FastAPI的异步特性实现高性能、并发计算,增强应用程序的响应能力和可扩展性。
  4. 数据可视化工具,提供了一种简单的方式,让用户创建美观、交互式的图表和仪表板,可以轻松地导入数据并共享,用户可以使用一键操作将数据集中到一个地方,而无需编写代码。

    工具还提供了一些功能,如添加趋势线、平均线、注释以及选择不同的主题颜色。Graphy支持多种用途,包括为组织提供富有上下文的数据报告、回答即时问题、外部报告以及增加观众参与度,Graphy提供免费使用,支持无限的图表和观众。

    Graphy | #工具
  5. PolyMind:多模态、函数调用驱动的LLM webui,旨在与Mixtral 8x7B + TabbyAPI一起使用,提供了广泛的功能:

    使用 DuckDuckGo 和网络抓取功能进行互联网搜索。
    使用 comfyui 生成图像。
    使用 sharegpt4v(通过 llama.cpp 的服务器)、OCR 和 Yolo 输入图像。
    使用nmap进行端口扫描。
    Wolfram Alpha 集成。
    Python 解释器。
    RAG 可对 PDF 和各种文本文件进行语义搜索。
    90% 的 Web 部件(HTML、JS、CSS 和 Flask)完全由 Mixtral 编写。
  6. ProChat:快速搭建大语言模型 Chat 对话的前端组件库,旨在赋予开发人员轻松打造丰富、动态和直观的聊天界面的能力
  7. 一本教授学术搜索的工具书,教你如何通过学术搜索引擎等精准的搜索,在各类数据库中搜索到想要的信息。前面有理论知识,后面有案例,理论结合实际,从入门到精通,很实用。| #论文 #电子书 #学术

    作者郭劲赤,华东师范大学图书馆副研究馆员。长期从事信息素养相关课程的一线教学,主讲的华东师范大学研究生课程和“文献调研与信息检索”在线课程为热门课程。主持国家社科基金项目等课题,发表SSCI论文4篇,担任SSCI期刊审稿人。

    本书主要面向广大高校学生、教师和研究人员,以及对科研、论文写作、信息搜集感兴趣的人士。

    全书内容涵盖学习、研究过程中的各类信息搜索,包含丰富的实用技巧与有趣的案例故事,帮你打破传统检索方式,实现精准“学术搜索” 。

    本书内容由浅入深,共分四篇(导论篇、入门篇、精通篇、学术规范篇)十五章,具体涵盖了:
    1.纸本资源导航,包括国家图书馆和上海图书馆的馆藏资源,联合目录CASHL、NSTL、CALIS等;
    2.学术搜索引擎使用指南,包括Semantic Scholar、BASE等;
    3.期刊数据库使用攻略,包括知网、万方、维普、ScienceDirect、EBSCO等;
    4.图书数据库使用要点,包括超星、读秀、SpringerLink等;
    5.学位论文数据库使用诀窍,包括知网、万方、PQDT等;
    6.引文数据库利用方法,包括CSSCI、SCI、Web of Science、Scopus等;
    7.统计数据库介绍,包括中国经济社会大数据研究平台、OECD iLibrary、国际组织数据公开网站等。

    同时专门为奋战在“论文写作前线”的读者准备了论文写作与投稿规范、如何辨别真假投稿期刊、论文查重“通关秘籍”等内容。 为沉迷手机上网的读者专辟一章,讲解如何利用手机等移动设备访问图书馆和数据库App。通过本书,帮助读者成为学术信息搜索达人,尽情遨游学术海洋。
    学术搜索:从入门到精通.pdf
    109.6 MB
  8. StreamRAG: GPT驱动的视频检索和流媒体工具,可以用于以下用途:上传多个视频以创建库或集合,搜索这些视频并获得实时视频响应或编译,将可搜索的集合发布到ChatGPT商店,接收摘要文本答案(RAG),从特定视频获得关键见解 | #工具