网上冲浪周刊第45期

欢迎阅读本期技术资讯!我们为您推荐了一些有趣的工具,如最懂程序员的新一代 AI 搜索引擎 Devv、文本生成语音模型 ChatTTS 及其 UI 项目、视频翻译配音工具 PYVIDEOTRANS。此外,还介绍了美图开源任务队列 LMSTFY 和动手学深度学习资源。

https://www.pexels.com/zh-cn/photo/348706/


欢迎来到第45期 !😄

期待您通过RSS订阅我们:https://www.lifeee.top//atom.xml


技术

推荐阅读

  • 这是你们项目中WebView的样子吗?:文章探讨了项目中WebView的使用规范和功能,包括可监控性、与前端的交互、安全问题以及WebView的封装思路。

  • 盘点 Google I/O 2024 的 Android 领域关键进展 :

    文章的主要内容和进展包括:

    • AI编程助手:Gemini正式纳入产品家族,帮助提高代码质量和开发效率。
    • 生成式AI应用:提供云端和设备端的大模型能力,助力开发新型应用。
    • 不同屏幕尺寸适配:通过Compose自适应布局API,简化多设备适配。
    • 桌面小部件:Jetpack Glance框架更新,提供新设计规范和UI组件库。
    • 跨设备类型开发:Jetpack Compose更新,支持更广泛的Android设备生态系统。
    • WearOS & 可穿戴:Wear OS 5预览版发布,带来电池续航和表盘格式改进。
    • Android for Car:Android Auto和Android Automotive OS进展,推动车机系统智能化。
    • Android TV:Android TV OS增长迅速,推出Android 14 for TV和Compose for TV。
    • Google Home API:基于Matter,简化家用产品开发,提供更丰富的家庭自动化体验。
    • Kotlin Multiplatform:Jetpack库迁移到KMP,推荐开发者共享跨平台业务逻辑。
    • Jetpack Compose:宣布新版本更新,增强跨设备适配和UI组件。
    • Android Studio:发布新版本,引入Gemini功能和UI自动化测试插件。
    • Google Play:分享最新进展,帮助开发者打造高质量用户体验和优化收入。
    • Checks:提供应用隐私合规检查服务,帮助遵守隐私法规。
    • Android 15:发布第二个测试版,注重提高生产效率、电池性能和应用流畅性。
  • Android vold (卷管理) 传记 : 文章以自述和对话的方式详细介绍了Android系统中vold的作用、如何监听外部存储设备的热插拔事件、管理卷的方式以及为应用创建目录的能力。

    文章的主要内容和要点包括:

    • vold简介:vold是volume daemon的缩写,负责管理所有卷,包括加密解密CE和DE类型的目录,以及对存储设备或卷进行挂载、卸载、格式化等操作。
    • vold的作用:为app提供存储服务,管理卷信息,并与StorageManagerService通信,使应用能够访问外部存储。
    • 卷管理:介绍了vold如何收集和管理外部存储设备卷和虚拟卷,以及如何通过NetlinkManager和VolumeManager类来处理uevent事件。
    • 挂载userdata分区:解释了vold如何挂载userdata分区到/data目录,以及fstab文件的作用。
    • 解密CE和DE类型目录:简要提及了vold如何解密这些目录,具体内容在其他文章中介绍。
    • 为app创建data和obb目录:vold利用其root权限为应用在外部存储下创建具有正确权限的data和obb目录。


有趣的工具

最懂程序员的新一代 AI 搜索引擎

Devv 支持直接连接 GitHub 仓库,进行搜索、提问、生成代码 , 非常适合程序员。

快速模式:基于 Devv 构建的 AI 搜索引擎,快速获取编程问题的答案、文档以及代码片段。

Agent 模式:为复杂的开发问题提供 Agent 驱动的解决方案,涵盖问题搜索、代码生成、Debug 等场景。

GitHub 模式:连接指定的公开或私有 GitHub 仓库,实现针对特定代码库的搜索、问答以及代码生成。

地址:https://devv.ai/

ChatTTS:文本生成语音

ChatTTS 是专为 LLM 助手等对话场景设计的文本到语音模型。它支持中英文两种语言。我们的模型经过 100,000+ 小时的中英文训练。HuggingFace 上的开源版本是不含 SFT 的 40,000 小时预训练模型。

亮点

  1. 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
  2. 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
  3. 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

对于模型的具体介绍, 可以参考B站的 宣传视频

开源地址:https://github.com/2noise/chattts

官网:https://2noise.com/

ChatTTS-ui

ChatTTS-ui 是一个开源项目,主要用于文本到语音转换(Text-to-Speech, TTS)。该项目的主要功能是将输入的文本转换为语音输出,可能用于各种需要语音合成功能的应用场景,如聊天机器人、语音助手等。
提供了网页中使用 ChatTTS 合成语音及 API 接口服务,支持 Windows、Linux、macOS 部署。其中 Windows 用户可直接下载安装包,一键安装开箱即用。

从项目的名称和文件结构来看,ChatTTS-ui 提供了一个用户界面(UI),使用户可以方便地输入文本并获得语音输出。项目的核心功能可能包括文本处理、语音合成以及用户界面的设计和实现。

主要功能

  1. 文本到语音转换:将输入的文本转换为语音输出。
  2. 用户界面:提供一个直观的界面,用户可以在其中输入文本并播放生成的语音。
  3. 开源社区支持:项目在 GitHub 上开源,用户和开发者可以贡献代码、报告问题和提出改进建议。

开源地址:https://github.com/jianchang512/ChatTTS-ui

pyVideoTrans视频翻译配音

一键实现语音识别->字幕翻译->配音 = 带字幕和配音的新视频。

特性:

💥自动视频翻译

集成faster-whisper模型/并支持自定义huggingface模型
同时集成批量语音转字幕、批量字幕翻译、批量配音小工具

🤠多种配音和翻译渠道

配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS
翻译:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|腾讯|本地模型

🤖可完全离线

翻译渠道替换为本地模型,配音渠道替换为clone-voice,即可实现完全本地离线视频翻译

🚀免费+开源

代码GitHub公开可审查,免费无功能限制,无隐藏收费
开源协议GPL-v3

官网:https://pyvideotrans.com/

下载地址:https://pyvideotrans.com/downpackage.html



宝藏信息

美图开源任务队列 lmstfy

具有 REST API 的任务队列 基于 redis 存储,使用 golang 开发,资源占用少,轻量级,并且经受美图线上环境大流量验证多年,较适合用来做延迟队列。

开源地址:https://github.com/bitleak/lmstfy

动手学深度学习

《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。

特性:

  1. 所有人均可在网上免费获取;

  2. 提供足够的技术深度,从而帮助读者实际成为深度学习应用科学家:既理解数学原理,又能够实现并不断改进方法;

  3. 包含可运行的代码,为读者展示如何在实际中解决问题。这样不仅直接将数学公式对应成实际代码,而且可以修改代码、观察结果并及时获取经验;

  4. 允许我们和整个社区不断快速迭代内容,从而紧跟仍在高速发展的深度学习领域;

开源地址:https://github.com/d2l-ai/d2l-zh

在线网站:http://zh.d2l.ai/


资讯




后记

百闻不如一见,百见不如一试。

🎉 本文同步更新于 https://www.lifeee.top/posts/22872.html