Skip to main content

黑洞资源笔记

  1. Linux内核代码风格指南 | #linux #指南

    引语:
    这是一个简短的文档,描述了linux内核的首选代码风格。

    代码风格是因人而异的,而且我不愿意把自己的观点强加给任何人,但这就像我去做任何事情都必须遵循的原则那样,我也希望在绝大多数事上保持这种的态度。请 (在写代码时) 至少考虑一下这里的代码风格。
  2. 对比学习在NLP中的应用,很不错的资源汇总

    目前的NLP模型在很大程度上依赖于有效的表示学习算法。对比学习就是这样一种技术,它可以学习一个嵌入空间,使相似的数据样本对具有接近的表征,而不相似的样本则彼此相距甚远。它可以在有监督或无监督的情况下使用不同的损失函数来产生特定任务或通用的表征。虽然它最初使视觉任务获得了成功,但近年来,对比性NLP的出版物越来越多。这第一线的工作不仅在各种NLP任务中提供了有希望的性能改进,而且还提供了理想的特征,如任务无关的句子表示、忠实的文本生成、在0-shot和少量设置中的数据高效学习、可解释性和可解释性。

    Github | #NLP
  3. qsv:超快的命令行CSV文件处置工具

    qsv是流行的xsv实用程序的一个分支,它合并了自xsv 0.13.0 2018年5月发布以来的几个待处理PR。它还具有许多新功能和53个附加命令/子命令/操作(总共73个)

    Github | #工具
  4. Gorse是一个用Go编写的开源推荐系统。 Gorse旨在成为一个通用的开源推荐系统,可以快速引入各种在线服务。通过将项目、用户和交互数据导入Gorse,系统将自动训练模型为每个用户生成推荐。项目特点如下:

    - 多源推荐:对于用户,从不同的方式(流行、最新、基于用户、基于项目和协同过滤)收集推荐项目,并通过点击率预测进行排名
    - AutoML:通过后台模型搜索自动选择最佳推荐模型和策略
    - 分布式推荐:单节点训练,分布式预测,在推荐阶段实现水平扩展的能力
    - RESTful API:为数据 CRUD 和推荐请求提供 RESTful API
    - Dashboard:提供数据导入导出、监控、集群状态检查的dashboard

    Github | 官网地址
  5. 简单易用的TCP连接(池)调试工具

    通过tproxy我们可以接受任意TCP请求,然后转发到我们实际的TCP服务上,借此我们可以详细分析连接的建连、断连情况,可以理解各种参数对连接或者连接池的影响,可以帮助我们理解各种协议(HTTP2, gRPC,Redis, MySQL)的工作原理

    tproxy | #工具