黑洞资源笔记
-
-
-
- Open-LX01:小爱音箱mini定制固件,让小爱音箱mini成为一个完全自主控制的音箱
-
- 专注于快速生成高质量结构化表格数据的框架,支持许多单表和多表数据合成算法,可实现高达120倍的性能提升,并支持差分隐私和其他方法以增强合成数据的安全性。
合成数据是机器根据真实数据和算法生成的,它不包含敏感信息,但可以保留真实数据的特征。合成数据与真实数据之间不存在对应关系,并且不受 GDPR 和 ADPPA 等隐私法规的约束。实际应用中,无需担心隐私泄露的风险。高质量的合成数据还可以应用于数据开放、模型训练与调试、系统开发与测试等各个领域。
特点
高性能:支持多种统计数据合成算法,实现高达120倍的性能提升,无需GPU设备;针对大数据场景进行优化,有效降低内存消耗;持续跟踪学术界和工业界的最新进展,及时推出对优秀算法和模型的支持;通过torch等框架为深度学习模型提供分布式训练支持。
隐私增强功能:SDG支持差分隐私、匿名化等方法来增强合成数据的安全性。
易于扩展:支持以插件包的形式扩展模型、数据处理、数据连接器等
Synthetic Data Generator | #框架 - OpenAI发布新嵌入模型,降低GPT-3.5 Turbo价格 | blog
OpenAI发布了新的嵌入模型和API更新,包括两个新的嵌入模型、更新的GPT-4 Turbo预览模型、更新的GPT-3.5 Turbo模型和更新的文本审核模型。
新的嵌入模型包括一个小型高效的text-embedding-3-small模型和一个大型高性能的text-embedding-3-large模型,允许开发者在使用嵌入时权衡性能和成本,特别是可以通过减少嵌入的维数(即从序列的末尾移除一些数字)来实现。 这些模型能够创建最多3072维的嵌入。
OpenAI表示,发送到OpenAI API的数据默认不会被用来训练或改进OpenAI模型。 - 非母语者英语科研写作的几个技巧 | 文章 | #技巧 #经验
作为非英语母语者,作者Nuwan Bandara在写科研论文时面临语言障碍。他分享了7个提高写作的技巧。
在写作时遇到词语难点,先留白继续写,初稿允许留白。先写最熟悉的部分,如方法部分。注重绘制漂亮的图表。创建知识文档记录文献要点。
先写简单版本的导言,迭代完善。学习他人文章的写作方式,研读AI生成的文本扩展写作语言谱。
从舒适区开始写作,逐步拓展到其他部分,每部分迭代精炼,保持初稿推进。这些技巧帮助作者进步。
作为非英语母语科研人员,从文章语言结构上学习成功案例很重要,多阅读科研论文,掌握学术写作标准和语言表达。
AI生成的文本如ChatGPT虽不能直接引用,但可以用来优化语句结构,提高学术英语写作水平。 - MiniMalloc:专为机器学习模型静态内存分配而设计的先进算法,使用多种新的搜索技巧以高效解决此类问题
- CurlyQ 是一个实用程序,为curl 提供了一个简单的界面,并具有提取图像和链接、通过CSS 选择器或XPath 查找元素、获取详细标题信息等附加功能。
它被设计为脚本管道的一部分,将所有内容输出为结构化数据(JSON 或 YAML)。它还具有使对 JSON 端点的调用更容易的基本支持,但预计你会使用jq之类的东西来解析输出。 - Midlibrary:包含 4000 种 Midjourney 艺术风格的图象库
- 一个无障碍、可定制、开源的组件,可以将其复制并粘贴到应用程序中。| shadcn/ui
- 首次使用 xv6 和 6.1810 实验室进行操作系统内核开发 | 详文
- 用汇编语言编写的轻量级网络论坛引擎
AsmBB完全用汇编语言编写,并使用SQLite作为数据库后端。这就是为什么它可以在非常弱的托管上工作,同时为大量访问者提供服务,而不会出现滞后和延迟。
由于内部设计和减少的依赖性,AsmBB 是非常安全的 Web 应用程序。但它还支持加密数据库,安全性更高。
另外,AsmBB对运行环境的要求很少:
-x86 Linux 服务器。
-不管32位还是64位。无需任何专门预安装的库。
-最小/最便宜的 VPS 就可以了。共享主机也可以(如果支持 FastCGI)。
-支持 FastCGI 接口的 Web 服务器。AsmBB 已通过 Nginx、Apache、Lighttpd、Hiawatha,当然还有 RWASA 进行了测试。
AsmBB 易于定制和修改 - 它使用非常强大的模板系统,可以轻松定制论坛而无需实际修改代码。(不过这并不难)。
AsmBB | 二进制包 | repo
安装教程:使用 NGINX 和 systemd 安装 | 使用 RWASA 安装 -
-