他也指出,随着这种方式兴起,写作者的心态可能会改变——从“写给人看”转向“写给LLM看”。因为当LLM理解了内容,它能为不同读者定制和传递信息,实现更精准的沟通。
Karpathy还开源了一个名为reader3的工具,方便用户用LLM逐章阅读电子书(EPUB格式)。他强调目前还没有专门工具,自己通常就是复制粘贴到不同的LLM里轮换使用。
社区回应中,有人分享了类似经验:
- 用LLM辅助读书能大幅提升信息保留和理解深度,变被动阅读为主动思考。
- AI将教育从“一刀切”转变为个性化辅导,学生能随时通过对话拆解难题。
- 未来写作可能陷入“为AI优化”的循环,导致信息自我引用,创新受限。
- 有人开发工具让AI帮忙筛选和索引长文档,提升查阅效率。
也有人提醒,写作过度迎合AI可能让文字缺乏人性和灵魂。真正的学习和交流,依赖人类间的互动和思考,而非单纯AI的反馈。
此外,使用LLM读书的关键在于“提问的艺术”:
善问问题,AI才能激发更深入的洞见和持续的好奇心,创造自然流畅的对话,从而推动认知升级。
目前完全免费,支持公共仓库,未来将扩展到私有仓库和Gemini CLI。
这不仅是DeepWiki的升级版,更为复杂项目提供了极佳支持,极大降低了代码学习和维护的门槛。开发者们对其表现出极大期待,称其可能彻底改变团队协作和代码管理方式。
类似工具还有DeepWiki、DeepGraph和GitDiagram,分别侧重代码库可视化和理解,形成了AI辅助代码理解的生态圈。
这场由AI驱动的代码理解革命,不仅节省了大量学习时间,也推动了软件开发效率的飞跃。未来,理解代码不再是负担,而是轻松的对话与探索。
首先,面试过程压力巨大,别忘了保护好心理和身体健康,保持支持网络,合理作息。面试虽看似竞争,实则大家目标一致——希望你成功通过并接受offer。
面试难免会有失败,重要的是坚持和成长。即使被拒,别气馁,未来依然有机会。多家AI/ML公司面试经历告诉我们,面试其实也很有趣——你会接触顶尖专家,学习新技能,体验编程挑战。
准备是成功关键:建议至少投入约100小时刷题,如Leetcode,另花类似时间阅读论文、复习基础知识、模拟面试。所有对话都非“随便聊聊”,每次交流都是展现自我和热情的机会。
技术面试中,面试官希望你成功,切勿紧张。掌握策略:保持简洁介绍,解决一个问题后迅速进入下一个,适应白板和Python编码。善用“todo”注释和断言帮助自己理清思路,遇难题可适当调整思路。
行为面试重在讲故事,使用STAR(I)法则,准备涵盖领导力、失败经历等主题的真实案例,展现成长和反思。
领域面试需熟悉基础与前沿知识,准备好讨论论文和当前项目。利用ChatGPT、Deep Research等工具辅助学习。
拿到面试机会往往靠可见的优秀成果和人脉推荐。保持活跃,发布作品,参加活动,善用LinkedIn和个人主页。面试前务必了解招聘经理背景,真诚表达对职位和团队的热情。
谈判时别只盯着薪资,关注团队、使命、文化和生活品质。最终选择让你每天都乐于工作的地方。
AI research interviews | #面试 #经验
1. 放弃notebooks依赖,拥抱代码仓库。Colab和Kaggle方便,但真正的项目价值在于结构清晰、易维护的git repo,养成使用专业编辑器和工程化脚本的习惯,才是通向工业级开发的必经之路。
2. GPU永远不能闲着。深度学习的加速根本在于大规模并行计算。就像撕散书页在桌面铺开,GPU能同时处理海量数据。利用Wandb等MLOps工具实时监控GPU使用率,避免资源浪费,是保证训练效率的关键。
3. 持续优化代码细节。比如作者通过替换Parquet Reader为Dataloader、用PyTorch内置的Scaled Dot Product Attention替代自定义实现,token处理速度提升近10倍。性能提升往往藏在内核融合和内存优化的细节里,别放过任何提升空间。
4. 时刻关注张量维度。深度学习中Tensor维度变化频繁,做好注释、标明形状,避免因转置、reshape导致的逻辑混乱,是代码可读性和debug效率提升的基础。
5. 深刻理解模型组件差异。GPT用LayerNorm,Llama改用RMSNorm。拆解每个子模块,理解其设计动机和作用,才能更好地把握整张架构图,代码实现也能更加准确高效。
6. 善于横向比较架构演进。新模型往往在旧模型基础上做局部创新,比如Mixture of Experts用多个小网络替代大网络结构。通过对比,抓住关键创新点,快速洞察论文核心,有助于精准实现和性能评估。
最后,初学时别怕依赖如Grok、GPT、Gemini等工具,失败是成长的必经阶段,坚持下来终能独立驾驭复杂模型。
Learnings after coding GPT & Llama from scratch :) | #经验
Gemini 3的核心变化:
- 自动规划多步工作流程,完全自主执行,无需任何指导
- 面向非技术用户,无需计算机专业背景
- 已在移动端上线,触手可及
与那些“AI机构”高价卖战略方案不同,谷歌直接将真正的自动化能力带给了比ChatGPT用户还多的人群。AI自动化的门槛瞬间降至:只需一部手机,4分钟设置。
现实是,很多企业还在固守“半年规划+技术团队+高额咨询费”的老思维,殊不知时代已经变了。真正的竞争力来自把AI当作本能,而非项目。
更深层的启示是:自动化变得轻松,不代表价值消失,而是价值上移。低阶重复的流程被机器取代,高阶的判断力、策略设计和运营模式将成为稀缺资产。