黑洞资源笔记

06:02 · Apr 3, 2023 · Mon

一个可视化爬虫软件，可以无代码图形化设计和执行的爬虫任务。支持中文和英文版本。

EasySpider | #可视化 #爬虫

18:09

Media is too big
VIEW IN TELEGRAM

可视化爬虫
15:34 · Apr 2, 2023 · Sun

这是斯坦福的新课CS324，从另一个视角讲解了大模型的建模、理论、伦理和系统方面的基础知识 | 地址
14:26 · Apr 2, 2023 · Sun

Copilot Hub 发布了新的功能：可以基于一系列网页链接的内容来创建自定义的 ChatGPT

使用场景：
- 主题研究分析
- 网站聊天机器人
- 个人博客助手
12:22 · Apr 2, 2023 · Sun

使用ChatGPT翻译字幕文件。在 OpenAI 的帮助下，在几秒钟内生成视频的字幕、章节和摘要。

subvert | #工具

工具
02:52 · Apr 2, 2023 · Sun

内推|HVV急需红蓝选手 | 详情
15:50 · Apr 1, 2023 · Sat

Twitter算法对于人类的解读第一部分：权威性。

在Twitter上，权威性是非常重要的因素之一。Twitter算法将会考虑一个用户的权威性，以决定他们的推文是否会显示在其他用户的时间线上。

Twitter使用多种方式来确定用户的权威性，其中包括：

关注者数量：一个用户的关注者数量越多，通常表示这个用户在Twitter社区中的地位越高。
关注者的权威性：如果关注一个用户的其他用户也是Twitter社区的重要成员，那么这个用户的权威性就会更高。
发送的推文的互动：如果一个用户的推文得到了其他用户的喜欢、转发、回复等互动，那么这个用户的权威性就会更高。
个人资料信息：用户的个人资料中包含的信息，如他们的个人简介、位置、教育背景等，也会被算法考虑在内。
总之，要提高自己在Twitter上的权威性，一个用户需要努力吸引更多的关注者，与Twitter社区的其他成员互动，并确保他们的个人资料信息准确完整。
01:16 · Mar 31, 2023 · Fri

开源版的"文心一言"：Visual OpenLLM，基于 ChatGLM + Visual ChatGPT + Stable Diffusion，以交互方式连接不同视觉模型的开源工具 | #工具

工具
00:37 · Mar 31, 2023 · Fri

有推主（@tarantulae）吐槽最近99%的类ChatGPT模型，几乎都是来源Meta开源的LLaMA，然后拿ChatGPT的数据（来自ShareGPT插件，这是个快速分享ChatGPT AI 对话的浏览器插件）做了一些微调，然后改个名字就变成开源了新的ChatGPT模型，本质上是在营销而已。
00:13 · Mar 31, 2023 · Fri

使用 OpenAI 的 GPT API 抓取网站的实验库scrapeghost。该库提供了一种从 HTML 中抓取结构化数据的方法，而无需编写特定于页面的代码。| 传送门
00:03 · Mar 31, 2023 · Fri

使用 AI 在研究论文中寻找答案，基于 GPT-4 的科学总结。目前为beta版本。

网站让你可以输入问题，然后它利用GPT-4来帮你找到最贴切的 5-10 篇论文里的答案。目前不支持中文输入。

Consensus
23:58 · Mar 30, 2023 · Thu

使用 Regex.ai 书写正则表达式

基于 AI 技术，比ChatGPT更加直观，不需要用语言描述，直接选择你想要获取的部分，会自动完成。

Regex.ai | #正则表达式

正则表达式
07:25 · Mar 30, 2023 · Thu

这是一个允许你从多个来源收集电影剧本的工具，并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库，同时还有电影的元数据。

整个过程有四个步骤：
从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本
收集元数据 - 从TMDb和IMDb获取关于剧本的元数据，以便进行额外处理
查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。
解析脚本 - 将脚本转换为只含人物和对话的行文

The Movie Script Database | #工具 #剧本

工具剧本
14:42 · Mar 29, 2023 · Wed

用 240 行纯 Java 代码编写的性能剖析器Tiny Profiler | Tiny Profiler | 主页
14:26 · Mar 29, 2023 · Wed

AnswerOverflow：将 Discord 帮助频道问题编入 Google 索引 | 文档 | 主页
14:22 · Mar 29, 2023 · Wed

NSA Ghidra 软件逆向工程框架。

Ghidra是由美国国家安全局研究总局创建和维护的软件逆向工程(SRE)框架。该框架包括一套全功能的高端软件分析工具，使用户能够在各种平台上分析编译代码，包括Windows、macOS和Linux。其功能包括反汇编、汇编、反编译、图形化和脚本化，以及数百个其他功能。Ghidra支持各种处理器指令集和可执行格式，并可在用户交互和自动化模式下运行。用户还可以使用Java或Python开发自己的Ghidra扩展组件和/或脚本。

为支持NSA的网络安全任务，Ghidra旨在解决复杂SRE工作中的可扩展性和团队协作问题，并提供可定制和可扩展的SRE研究平台。NSA已将Ghidra SRE能力应用于涉及分析恶意代码和为SRE分析师生成深入洞察力的各种问题中，以更好地了解网络和系统中潜在的漏洞。

Ghidra | #框架

框架
14:14 · Mar 29, 2023 · Wed

TaxyAI：使用 GPT-4 的开源浏览器自动化

Taxy使用GPT-4控制浏览器，并代表人来执行重复的操作。目前，它允许定义临时指令。将来，它还将支持保存和预定工作流。

Taxy目前处于研究预览状态。许多工作流程失败或使代理程序混淆。如果想在Taxy上进行改进或在自己的工作流程上进行测试，请按照说明在本地运行。

评论区有演示