Skip to main content

黑洞资源笔记

  1. <上海交通大学生存>于08年由一群交大本科生写就,12年过去了无数交大学子受益于它,但有些内容可能已经过时,由于原作者团队主要属于出国攻读博士群体,本手册在国内深造、国内就业等方面存在欠缺。本项目旨在将它制作成gitbook发布,并长期维护该项目,希望能给未来的交大在读和入学新生同学带来微小的帮助

    传送门 | #手册
  2. 一种为机器学习而生的数据结构,非结构化多模态数据的数据结构

    DocArray是一个库,用于存储传输中的嵌套、非结构化、多模态数据,包括文本、图像、音频、视频、3D 网格等。它允许深度学习工程师使用Pythonic API有效地处理,嵌入,搜索,推荐,存储和传输多模态数据

    /多模式世界之门:用于表示复杂/混合/嵌套文本、图像、视频、音频、3D 网格数据的超表达数据结构。JinaCLIP-as-serviceDALL·E FlowDiscoArt等基础数据结构。
    数据科学强国:通过 CPU/GPU 上的 Torch/TensorFlow/ONNX/PaddlePaddle 大大加快数据科学家在嵌入、k-NN 匹配、查询、可视化和评估方面的工作。
    传输中的数据:针对网络通信进行了优化,随时可以使用 Protobuf、字节、base64、JSON、CSV、DataFrame 中的快速压缩序列化。非常适合流式传输和内存不足的数据。
    一站式K-NN:主流向量数据库的统一且一致的API,允许最近邻搜索,包括Elasticsearch、Redis、ANNLite、Qdrant、Weaviate。
    对于现代应用程序:GraphQL 支持使您的服务器在请求和响应方面具有通用性;内置数据验证和 JSON Schema (OpenAPI) 帮助您构建可靠的 Web 服务。
    Pythonic:设计得像 Python 列表一样简单。如果你知道如何使用 Python,你就会知道如何使用 DocArray。直观的习惯用法和类型注释简化了您编写的代码。
    与IDE集成:Jupyter notebook 和 Google Colab 上的漂亮打印和可视化;PyCharm 和 VS Code 中的全面自动完成和类型提示。

    DocArray | 文档 | #机器学习
  3. 「Linux核心設計」系列講座(繁体)

    从Linux核心4.1版开始,整个原始程式码的规模就超越2000万行,换句话说,已经没有任何人可掌握Linux核心的每一行程式码,我们也不该频频举烛地阅读Linux核心程式码,我们需要有系统的分析方法去学习并运用Linux核心。

    传送门 | #linux