百晓生 - 技术,生活,随看 \随转

技术,生活,随看 \随转

在微博上看到有人介绍 Hero3046 这位日语老师的课程，言辞风趣幽默，讲解深入浅出，不像标准日本语的课程那样枯燥乏味，不知不觉跟着学了两个小时，值得推荐！

#资源

资源

04:30 · Jul 25, 2023 · Tue

#系统设计
《DDIA 逐章精读》，配套的视频见 B 站，油管。

Qtmuniao

DDIA 逐章精读

DDIA读书笔记 DDIA精读笔记 DDIA翻译

系统设计

01:32 · Jul 25, 2023 · Tue

Llama2-webui：允许用户在任何地方（Linux/Windows/Mac）通过 gradio web UI 在 GPU 或 CPU 上运行 Llama 2。

它支持 Llama-2-7B/13B/70B，并且可以使用 8-bit 或 4-bit 模式。它支持至少有 6 GB VRAM 的 GPU 推理，以及至少有 6 GB RAM 的 CPU 推理。

支持多种模型：Llama-2-7b/13b/70b，所有的Llama-2-GPTQ，所有的Llama-2-GGML等

支持多种模型后端：Nvidia GPU（transformers，bitsandbytes（8-bit 推理），AutoGPTQ（4-bit 推理）），CPU，Mac/AMD GPU（llama.cpp）

Web UI接口：gradio

13:26 · Jul 24, 2023 · Mon

https://t.co/U2gdIKeqBR

09:07 · Jul 24, 2023 · Mon

https://github.com/lissy93/dashy

GitHub

GitHub - Lissy93/dashy: 🚀 A self-hostable personal dashboard built for you. Includes status-checking, widgets, themes, icon packs…

🚀 A self-hostable personal dashboard built for you. Includes status-checking, widgets, themes, icon packs, a UI editor and tons more! - Lissy93/dashy

09:04 · Jul 24, 2023 · Mon

🤖 un.block.ai for Web3 and Developers #8

🏦 融资

1. AI 和加密货币初创公司 Giza 获得 300 万美元融资，并推出自家框架 Cairo 的简易教程
2. 自动化客服公司 AwesomeQA 获得 280 万美元融资，Coinbase Ventures 和 Uniswap Labs Ventures 参投
3. Web3 开发公司法国 Narval 完成 400 万美元的种子融资，BlockTower VC 领投
4. FTX Japan 开始招聘，称将关注 AI 开发领域
5. 日本企业 Cybozu 推出新基金 Kintone Teamwork Fund，聚焦于 Web3 和 AI
6. Lighting Labs 推出基于 AI 的比特币模型，可使用基于大型语言模型的应用进行比特币交易
7. 筑波大学团队推出基于链上数据的 AI 投资组合管理系统 CryptoRLPM
8. Web3 数据智能公司 Web3Go 获得 400 万美元融资，Binance Labs 及 Hashkey Capital参投
9. 基于 ZK-rollup 证明技术的 Web3 隐私公司 Ola 获得 300 万美元融资，Foresight Ventures 参投

💬 洞见

Emerging Architecture for LLM Applications

这篇文章展示了目前开发，维护一个 AI App 需要的基础设施。

文章中主要关注于结合上下文，数据库，使用 LLM 提供更加精准、实时的答案，降低幻觉的发生。

除了问答机器人，另一个 a16z 觉得有前途的方向是 Agents。AI 使用工具和自我反馈、学习来达成一些目标，例如全自动写代码，写报告，改 Bug 等等。在其他大的 AI 企业也看到正在努力钻研 Agents 方向。

State of GPT

GPT 的训练分为四个阶段

- 预训练
- 监督训练
- 奖励训练
- 强化训练

目前大部分模型为与训练后的模型，例如 GPT，LLaMA，PaLM。他们擅长补全文章，但是不擅长指令，和用户问答。这一阶段需要的资源和数据量最大。

在这些基础模型之上，开发者进行监督训练。让这些基础模型具备回应指令的功能，例如 Vicuna-13B。

奖励训练和强化训练可以提升模型输出的质量，到那时训练过程较为复杂，很少有模型经过这两个阶段。

Chain of Thoughts 背后的原理是 LLM 无法区分哪一部分文字需要花更多时间思考。LLM 在每一个生成的文字上所花费的计算资源是一样的。这就导致了面对较难的问题容易出错因为计算时间不够长。让 LLM 多思考的方法就是让它多生成文字。对于指定问题生成更多的文字就代表它思考的越多，花费了更多计算资源。

角色扮演背后的原理是虽然 LLM 可以分辨答案的优劣，但 LLM 并不会下意识的输出最优质的答案。通过专业，高 IQ 等角色预设，LLM 会输出更加优质的答案。

目前有效的 Prompt 技巧是

- Tree works
- Chain of thoughts works
- ReAct works

但是 Auto GPT 并没有被证明有效。将任务分成子任务并不一定是有效的方案。

Vector Database

为何使用向量数据库？

- LLM 中的信息是过时的。如果我们想要注入数据，我们需要向量数据库
- 企业想要与他们的数据进行交流

为什么我们不把所有东西都放在提示里？

- 我们构建一个数据缓存层。它在向量库中存储相关信息和生成的聊天内容。通过不在提示中发送所有内容，我们可以降低成本

为什么我们不微调模型以获取新信息？

- LLM 是统计模型。它需要大量相似的样本来更新信息

如何构建一个文档问答机器人？

- 抓取所有文档并将其存储在向量数据库中。生成样本问题和答案并将它们存储在向量数据库中（有这样的文档，我可以问哪些问题）

何时不使用向量数据库？

- 如果是键值对
- 如果不是语义的

如何保持向量数据库中的数据更新是当前行业的一个问题

频道：@unblock256

01:26 · Jul 24, 2023 · Mon

【书名】走向繁荣的战略选择
【作者】厉以宁，孟晓苏，李源潮，李克强
【格式】#epub #mobi #azw3 #pdf
【分类】#经济学 #战略 #改革 #中国
【简介】本书就如何进一步加快经济改革，使中国经济进入良性发展的轨道等问题，进行了全面、系统和精辟的理论阐述，并就实践的路径进行了深入探讨。本书出版于上世纪九十年代初期，内容对于解决当前中国经济改革与发展所面临的一系列问题，毫无过时之感，仍然具有很强的现实指导作用。

📚 阅读：点击下载
📢 频道：@sharebooks4you
👥 群组：@sharing_books4u

epub mobi azw3 pdf 经济学战略改革中国

10:52 · Jul 23, 2023 · Sun

https://staging.yinxiang.com/product/miniapp/
印象笔记清单扫描宝食tang

10:02 · Jul 23, 2023 · Sun

发布国家图书馆藏善本和普通古籍、法国国家图书馆藏敦煌遗书、天津图书馆藏普通古籍、日本永青文库捐赠汉籍、云南省图书馆善本古籍、芷兰斋藏稿抄校本等古籍影像资源，总量超过3.3万部。

中华古籍保护网 | #古籍

古籍

10:01 · Jul 23, 2023 · Sun

向量数据库

本文主要介绍了向量数据库的原理和实现，包括向量数据库的基本概念、相似性搜索算法、相似性测量算法、过滤算法和向量数据库的选型等等。

向量数据库是崭新的领域，目前大部分向量数据库公司的估值乘着 AI 和 GPT 的东风从而飞速的增长，但是在实际的业务场景中，向量数据库的应用场景还比较少，抛开浮躁的外衣，向量数据库的应用场景还需要开发者们和业务专家们去挖掘。

05:10 · Jul 23, 2023 · Sun

https://www.youtube.com/watch?v=43BKvDaJBug 强烈推荐

YouTube

超实用！4款外语神器，无障碍阅读英文网站、视频 | Trancy | Grammarly | Google | chatGPT

看看我又挖到了什么好东西，4款工具让你语言力MAX！还怕读不懂英语吗？

03:23 · Jul 23, 2023 · Sun

向量数据库 https://guangzhengli.com/blog/zh/vector-database/

Guangzhengli

向量数据库

也许你最近可能听过这样的新闻，某向量数据库的初创公司刚写好 PPT，就获得了几千万的投资，某公司的开源的向量数据库因其代码的简陋而登上了 Hackernews 等等。在过去几个月时间中， AI 应用的发展如火如荼，带动了 AI 应用技术栈上下游的火爆，而向量数据库就是其中最热门的之一。
笔者最近因为开发 ChatFiles 和 VectorHub 两款开源项目的需要从而对向量数据库（Vector Database）进行了学习，在对主流的向量数据库和搜索算法有了大概的了解后，笔者决定将这些知识整理成一篇文章，希望能够帮助到大家。

01:24 · Jul 23, 2023 · Sun