网上冲浪周刊第91期
欢迎阅读本期技术资讯!我们为您带来一系列前沿工具与解决方案:OpenAI推出的Codex(终端轻量级编码代理,支持自然语言转代码与多模态输入,实现ChatGPT级推理能力);沉浸式翻译的Babeldoc(精准保持PDF排版与图表公式解析,免费版每月千页翻译额度,Pro版集成DeepSeek高级模型);浏览器自动化神器Browser-use(Python开发,支持Playwright集成,轻松完成购物车添加、LinkedIn关系处理等任务,GitHub星标超59,000)。此外,还推荐macOS菜单栏管理工具Ice(自定义隐藏与显示项目,优化工作区布局);提升微信公众号长文阅读体验的公众号阅读增强器(智能目录导航、图片放大与实时位置追踪);腾讯开源的Kuikly(基于Kotlin的全平台框架,实现多端UI一致性,已应用于QQ、QQ音乐等产品);以及开源免费的远程控制工具BilldDesk(支持多平台、多屏操作与私有化部署,无连接限制,媲美商业软件功能)。
欢迎来到第91期 , 期待您通过RSS订阅我们:https://www.lifeee.top//atom.xml
推荐阅读
Kotlin 技术月报 | 2025 年 4 月: 2025 年 4 月的 Kotlin 技术月报涵盖了当月 Kotlin 的主要更新和社区动态。关键更新包括引入了模糊测试库 kotlinx.fuzz,帮助开发者更轻松地进行模糊测试;Context Parameters 特性在 Kotlin 2.2.0 版本中以 Beta 形式发布,提升了扩展方法和 DSL 开发的能力;K2 模式在 IntelliJ IDEA 2025.1 中默认启用,带来了性能提升和新语言特性的支持。此外,JetBrains 推出了 Junie 和 AI 助手,为 Kotlin 开发者提供了更智能的编码工具。社区方面,KotlinConf 2025 即将到来,带来了一系列精彩的演讲和活动。
关于 MCP 的几个理解误区- 即刻App: 文章详细分析了关于 MCP(模型上下文协议)的几个常见误解。首先,MCP 协议并不需要大模型支持,其核心是指导应用层如何更好地补充上下文信息给大模型,即使使用较旧的模型(如 GPT-2)也可以通过 MCP 协议补充上下文信息。其次,文章指出并非只有支持 FunctionCalling 的模型才能使用 MCP 协议,FunctionCalling 是一种交互范式,而 MCP 是对这种机制的包装与升级,不支持 FunctionCalling 的模型也可以通过提示词工程实现类似功能。最后,文章澄清了大模型原生支持 MCP 协议的说法,认为这种说法不准确,因为大模型不可能内化所有基于 MCP 协议定义的工具,尤其是在面对海量且私有的资源时。
AI信息
OpenAI Codex:程序员的 AI 编程助手,让代码自己写自己
OpenAI 开源的 Codex 项目是一个在终端运行的轻量级编码代理,能够将自然语言转化为可执行代码。Codex 的使用非常简单,通过全局安装并设置 OpenAI API 密钥即可使用。它为开发者提供了 ChatGPT 级别的推理能力,支持在版本控制下运行代码、操作文件和迭代。Codex 的特点包括零配置、全自动审批、多模态支持(支持传入截图或图表),并且完全开源。项目地址为 https://github.com/openai/codex,用户可以自行查看和参与其发展。
开源地址: https://github.com/openai/codex
Babeldoc:沉浸式翻译的 PDF 翻译神器,保持排版且完全免费
沉浸式翻译推出了一款名为 Babeldoc 的 PDF 翻译工具,它能够保持 PDF 文档的原始排版,并完整提取图表、脚注、公式等非文本元素。该工具通过解析 PDF 结构并记忆布局信息,确保翻译后的内容能够无缝替换原文内容。Babeldoc 提供了免费版和 Pro 会员版两种套餐,免费版用户每月享有 1000 页的 PDF 解析翻译额度,而 Pro 会员则享有每月 10000 页额度,并接入 DeepSeek 高级翻译模型。此外,Babeldoc 项目是开源的,代码已发布在 GitHub 上。
开源地址 : https://github.com/funstory-ai/BabelDOC
AI 浏览器控制与自动化任务神器:Browser-use
browser-use/browser-use 是一个开源项目,一个旨在让 AI 代理能够控制浏览器、轻松实现在线任务自动化的工具。该项目使用 Python 语言开发,具有强大的功能,包括支持 AI 工具、浏览器自动化以及与 Playwright 等技术的集成。提供了丰富的示例和演示场景,例如添加商品到购物车、处理 LinkedIn 关系、在 Google Docs 中撰写文档等。还详细阐述了项目的愿景、路线图,包括改进智能代理记忆和规划能力、增强 DOM 提取功能、优化用户体验等。它采用 MIT 许可证,非常适合开发者使用和二次开发。目前该项目在 GitHub 上已获得超过 59,000 颗星标和 6,000 多次fork,显示出其在社区中的受欢迎程度。
开源地址:https://github.com/browser-use/browser-use
技术工具
macOS菜单栏管理工具 — Ice
Ice,这是一个强大的macOS菜单栏管理工具,旨在提供多样化的功能以增强用户体验。它支持隐藏和显示菜单栏项目、自定义菜单栏外观、设置快捷键等。
开源地址: https://github.com/jordanbaird/Ice
提升微信公众号阅读新体验:“公众号阅读增强器” 让长文阅读更轻松
“公众号阅读增强器”是一款专为提升微信公众号阅读体验而设计的浏览器扩展工具。该工具具备智能目录导航功能,可自动提取文章标题生成结构化目录,方便用户快速跳转和掌握文章脉络;图片查看增强功能允许用户点击放大查看文章中的任意图片,享受高清细节;阅读位置追踪功能则会在目录中高亮显示当前阅读位置,避免用户在长文中迷失 。
开源地址:https://github.com/someone1128/WeChatReaderEnhancer
安装地址: https://wxreader.browserplus.store/
腾讯 Kuikly 开源:基于 Kotlin 的全平台框架
Kuikly 是一个基于 Kotlin Multiplatform 的全平台框架,支持 Android、iOS、鸿蒙、Web 和小程序等多种平台。它通过自研 DSL 实现 UI 构建,利用 “薄原生层” 技术确保多端 UI 一致性,同时提供高性能的逻辑共享和动态化能力。Kuikly 的核心优势在于接近原生的性能体验和开发体验,同时支持动态化能力。目前,Kuikly 已在 QQ、QQ 音乐、腾讯新闻等多款产品中使用。
开源地址:https://github.com/Tencent-TDS/KuiklyUI/
官网:https://framework.tds.qq.com/
BilldDesk:开源免费的远程桌面控制工具,支持多平台和私有化部署
BilldDesk 是一个开源的远程桌面控制项目,基于 Vue3、WebRTC、Nodejs 和 Electron 等技术搭建。它实现了类似 ToDesk、向日葵等远程桌面的功能,但完全免费且无连接次数、画质等限制。该项目支持多平台,包括 Windows、macOS、Linux 和 Android,提供了丰富的功能,如多设备同时远程控制、多屏操作、文件传输、屏幕墙、按键组合键等。此外,BilldDesk 还支持私有化部署,用户可以根据自己的需求进行二次开发。
开源地址:https://github.com/galaxy-s10/billd-desk
后记
百闻不如一见,百见不如一试。
🎉 本文同步更新于 https://www.lifeee.top