网上冲浪周刊第45期
欢迎阅读本期技术资讯!我们为您推荐了一些有趣的工具,如最懂程序员的新一代 AI 搜索引擎 Devv、文本生成语音模型 ChatTTS 及其 UI 项目、视频翻译配音工具 PYVIDEOTRANS。此外,还介绍了美图开源任务队列 LMSTFY 和动手学深度学习资源。
欢迎来到第45期 !😄
期待您通过RSS订阅我们:https://www.lifeee.top//atom.xml
技术
推荐阅读
这是你们项目中WebView的样子吗?:文章探讨了项目中WebView的使用规范和功能,包括可监控性、与前端的交互、安全问题以及WebView的封装思路。
盘点 Google I/O 2024 的 Android 领域关键进展 :
文章的主要内容和进展包括:
- AI编程助手:Gemini正式纳入产品家族,帮助提高代码质量和开发效率。
- 生成式AI应用:提供云端和设备端的大模型能力,助力开发新型应用。
- 不同屏幕尺寸适配:通过Compose自适应布局API,简化多设备适配。
- 桌面小部件:Jetpack Glance框架更新,提供新设计规范和UI组件库。
- 跨设备类型开发:Jetpack Compose更新,支持更广泛的Android设备生态系统。
- WearOS & 可穿戴:Wear OS 5预览版发布,带来电池续航和表盘格式改进。
- Android for Car:Android Auto和Android Automotive OS进展,推动车机系统智能化。
- Android TV:Android TV OS增长迅速,推出Android 14 for TV和Compose for TV。
- Google Home API:基于Matter,简化家用产品开发,提供更丰富的家庭自动化体验。
- Kotlin Multiplatform:Jetpack库迁移到KMP,推荐开发者共享跨平台业务逻辑。
- Jetpack Compose:宣布新版本更新,增强跨设备适配和UI组件。
- Android Studio:发布新版本,引入Gemini功能和UI自动化测试插件。
- Google Play:分享最新进展,帮助开发者打造高质量用户体验和优化收入。
- Checks:提供应用隐私合规检查服务,帮助遵守隐私法规。
- Android 15:发布第二个测试版,注重提高生产效率、电池性能和应用流畅性。
Android vold (卷管理) 传记 : 文章以自述和对话的方式详细介绍了Android系统中vold的作用、如何监听外部存储设备的热插拔事件、管理卷的方式以及为应用创建目录的能力。
文章的主要内容和要点包括:
- vold简介:vold是volume daemon的缩写,负责管理所有卷,包括加密解密CE和DE类型的目录,以及对存储设备或卷进行挂载、卸载、格式化等操作。
- vold的作用:为app提供存储服务,管理卷信息,并与StorageManagerService通信,使应用能够访问外部存储。
- 卷管理:介绍了vold如何收集和管理外部存储设备卷和虚拟卷,以及如何通过NetlinkManager和VolumeManager类来处理uevent事件。
- 挂载userdata分区:解释了vold如何挂载userdata分区到/data目录,以及fstab文件的作用。
- 解密CE和DE类型目录:简要提及了vold如何解密这些目录,具体内容在其他文章中介绍。
- 为app创建data和obb目录:vold利用其root权限为应用在外部存储下创建具有正确权限的data和obb目录。
有趣的工具
最懂程序员的新一代 AI 搜索引擎
Devv 支持直接连接 GitHub 仓库,进行搜索、提问、生成代码 , 非常适合程序员。
快速模式:基于 Devv 构建的 AI 搜索引擎,快速获取编程问题的答案、文档以及代码片段。
Agent 模式:为复杂的开发问题提供 Agent 驱动的解决方案,涵盖问题搜索、代码生成、Debug 等场景。
GitHub 模式:连接指定的公开或私有 GitHub 仓库,实现针对特定代码库的搜索、问答以及代码生成。
ChatTTS:文本生成语音
ChatTTS 是专为 LLM 助手等对话场景设计的文本到语音模型。它支持中英文两种语言。我们的模型经过 100,000+ 小时的中英文训练。HuggingFace 上的开源版本是不含 SFT 的 40,000 小时预训练模型。
亮点
- 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
- 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
- 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
对于模型的具体介绍, 可以参考B站的 宣传视频
开源地址:https://github.com/2noise/chattts
ChatTTS-ui
ChatTTS-ui
是一个开源项目,主要用于文本到语音转换(Text-to-Speech, TTS)。该项目的主要功能是将输入的文本转换为语音输出,可能用于各种需要语音合成功能的应用场景,如聊天机器人、语音助手等。
提供了网页中使用 ChatTTS 合成语音及 API 接口服务,支持 Windows、Linux、macOS 部署。其中 Windows 用户可直接下载安装包,一键安装开箱即用。
从项目的名称和文件结构来看,ChatTTS-ui
提供了一个用户界面(UI),使用户可以方便地输入文本并获得语音输出。项目的核心功能可能包括文本处理、语音合成以及用户界面的设计和实现。
主要功能
- 文本到语音转换:将输入的文本转换为语音输出。
- 用户界面:提供一个直观的界面,用户可以在其中输入文本并播放生成的语音。
- 开源社区支持:项目在 GitHub 上开源,用户和开发者可以贡献代码、报告问题和提出改进建议。
开源地址:https://github.com/jianchang512/ChatTTS-ui
pyVideoTrans视频翻译配音
一键实现语音识别->字幕翻译->配音 = 带字幕和配音的新视频。
特性:
💥自动视频翻译
集成faster-whisper模型/并支持自定义huggingface模型
同时集成批量语音转字幕、批量字幕翻译、批量配音小工具
🤠多种配音和翻译渠道
配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS
翻译:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|腾讯|本地模型
🤖可完全离线
翻译渠道替换为本地模型,配音渠道替换为clone-voice,即可实现完全本地离线视频翻译
🚀免费+开源
代码GitHub公开可审查,免费无功能限制,无隐藏收费
开源协议GPL-v3
下载地址:https://pyvideotrans.com/downpackage.html
宝藏信息
美图开源任务队列 lmstfy
具有 REST API 的任务队列 基于 redis 存储,使用 golang 开发,资源占用少,轻量级,并且经受美图线上环境大流量验证多年,较适合用来做延迟队列。
开源地址:https://github.com/bitleak/lmstfy
动手学深度学习
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
特性:
所有人均可在网上免费获取;
提供足够的技术深度,从而帮助读者实际成为深度学习应用科学家:既理解数学原理,又能够实现并不断改进方法;
包含可运行的代码,为读者展示如何在实际中解决问题。这样不仅直接将数学公式对应成实际代码,而且可以修改代码、观察结果并及时获取经验;
允许我们和整个社区不断快速迭代内容,从而紧跟仍在高速发展的深度学习领域;
开源地址:https://github.com/d2l-ai/d2l-zh
在线网站:http://zh.d2l.ai/
资讯
后记
百闻不如一见,百见不如一试。
🎉 本文同步更新于 https://www.lifeee.top/posts/22872.html