黑洞资源笔记
-
-
- C++ 工程实践训练营 | 团购价220元
-
-
-
-
- CRUXEval是一个用于评估Python代码推理、理解和执行的基准,包含两个任务:CRUXEval-I和CRUXEval-O,用于评估输入和输出预测。
该基准测试包括800个Python函数和输入输出对,最佳模型GPT-4在CRUXEval-I和CRUXEval-O上的pass @ 1 分别达到67%和63%。尽管Code Llama 34B等模型在大量代码数据上进行了训练,但仅达到了47%和44%的准确率。
该基准测试强调了代码推理能力的重要性,并鼓励未来的代码语言模型评估考虑CRUXEval。 -
- Smart Excel:一个足够简单(调用CloseAI的API)却又功能俱全(有登录和支付)的demo级产品。
[技术栈]
前后端:Next.js+Tailwind+Prisma
登录:Next-Auth
支付:Lemon Squeezy
部署:Vercel
你可以基于这个项目快速开发自己的SaaS产品。
工作原理:该项目使用ChatGPT API和具有流功能的Vercel Al SDK。它基于表单和用户输入构建提示,将其发送至ChatGPTAPI通过Vercel边缘函数,然后将响应流式传输回应用程序界面。 -
- Alter3:一个能够执行 ChatGPT 指令的仿人机器人
东京大学的研究人员成功将仿人机器人 Alter3 与 GPT-4 连接。他们利用指令让这个机器人完成了一系列的人类行为,例如弹吉他、自拍、扮演鬼魂角色,甚至在电影院偷吃别人的爆米花。
这一过程可以看作是一场现代化的“哑剧游戏”:大语言模型 (Large Language Model) 将书面指令转换为可执行的代码,从而让机器人能够模仿出多种人类的动作。