Home

Awesome

<p align="center"> Paper2GUI 🚀🚀🌟: 让每个人都简单方便的使用前沿人工智能技术 </p>

Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 50+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、伴奏分离、字幕翻译、OCR 识别等领域。支持 Windows、Mac、Linux 系统。

<p align="center"><a href="README_en.md">English</a> | 中文 | <a href="https://t.me/baiyueblog">Telegram</a> | <a href="https://www.bilibili.com/video/BV1jY411u7yU">B站(媒体)</a></p>

下载小白兔 AI:

系统架构格式备注下载
Windowsx64exe适用于 win10 及以上下载
arm64exe适用于高通晓龙芯片下载
Macarm64dmg适用于苹果 M 系芯片下载
x64dmg适用于 Intel 芯片下载
Linuxx64debdeb 包适用于 Debian 系下载
arm64deb下载
x64rpmrpm 包适用于 RedHat 系下载
arm64rpm下载

已发布内容【下列独立 APP 完全免费】

文字转语音工具,适用于配音、讲解、说书、广告等场景。

名称大小Model多语言WindowsMacLinux下载
微软语音合成 🔥5MbFastSpeechDownload
阿里云语音合成13MbUnknown🔲Download

文本转图片,想象力与 AI 的完美结合

名称大小Model多语言WindowsMacLinux下载
StableDiffusion🔥10MbNaifu🔲🔲Download

视频超分工具,适用于 720p 或 360p 视频转 1080p 或 4k 视频,画质升级且不模糊,目前主要用于动漫视频超分。

名称大小Model多语言WindowsMacLinux下载
RealESRGAN-GUI(RAM)🔥41.8MbRealESRGANv3🔲🔲Download
waifu2x-GUI38.9Mbwaifu2x🔲🔲Download
RealESRGAN-GUI28.8MbRealESRGANv2🔲🔲🔲Download
RealCugan-GUI56.4MbRealCugan🔲🔲🔲Download
RealSR-GUI94.5MbRealSR🔲🔲🔲Download

运动类视频流畅度升级工具,可以将低帧率 30fps 升级到 60fps 或 360fps。适用于丝滑质感需求。

名称大小Model多语言WindowsMacLinux下载
RIFE-GUI(RAM)🔥51.2MbRife🔲🔲Download
DAIN-GUI72.6MbDain🔲🔲🔲Download

图像风格化,可以将照片转换为动漫风格、梵高风格、毕加索风格等等。

名称大小Model多语言WindowsMacLinux下载
AnimeGAN-GUI🔥8.9MbAnimeGANv2🔲🔲Download

AI 一键抠图,可生成透明图、绿幕、红幕、蓝幕等背景图片,头发丝处理良好,适合任意人物抠图需求。

名称大小Model多语言WindowsMacLinux下载
RVM-GUI🔥12.9Mbrvm🔲🔲🔲Download

人像修复,可以将人像修复为清晰的图片,提升清晰度。

名称大小Model多语言WindowsMacLinux下载
GFPGAN-GUI🔥242MbGFPGAN🔲🔲Download

视频抠图,利用 RVM 等算法,可实现无绿幕视频抠图,适合各种自媒体视频制作,节约大量时间。

名称大小Model多语言WindowsMacLinux下载
MODNet-GUI🔥77.5Mbmodnet🔲🔲🔲Download
MobileNetV2-GUI🔥34.6MbMobileNetV2🔲🔲🔲Download

适用范围太广,比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

名称大小Model多语言WindowsMacLinux下载
YOLOv6-GUI46Mbyolov6n🔲🔲Download
YOLOv5-GUI60.2Mbyolov5s🔲🔲Download
YOLOX-GUI50Mbyolox_nano🔲🔲Download

辅助工具,提供了一些常用的辅助工具,比如视频比对工具等。

名称大小Model多语言WindowsMacLinux下载
Video_compare🔥56.1Mb🔲🔲Download

小白兔 AI 是一款功能非常强大的人工智能软件,实现了 AI 绘画、语音合成、视频抠图、动漫超分辨、视频补帧、录音降噪、视频上色、人脸动漫化、图片修图、视频修复等 40 余种功能,致力于打造一款实用、好玩又有趣的 AI 生产力聚合工具箱。面向生产力用户,可免费试用 14 天,支持 Windows 和 Mac 系统。从 3.0 版起 AI 绘画、人脸动漫化、图片修复和视频补帧永久免费。

已内置功能适用场景功能简介
RealCugan-Pro 动漫超分辨动漫图片或视频超分辨放大自研 AI 引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用 RealCugan-Pro 模型的软件
RealESRGAN 动漫超分辨动漫图片或视频推理速度快,质量比 waifu2x 好太多,常规超分辨首选
智能抠图任意图片或视频推理速度快,一键获得透明图片或绿幕视,进行二次创作
人像动漫化仅适合头像处理转换效果出众,有趣又好玩
语音合成自媒体视频配音、有声读书等效果逼近真人,发音自然、带呼吸声、支持 txt 大文件极速合成
录音降噪真人配音后处理一键去除环境和背景噪音,提升录音清晰度,效果明显
视频补帧运动类视频流畅度升级工具可获得丝滑观感,已支持 RIFE 和 IFRNET 两种 AI 模型
一键超补同时完成超分和补帧融合超分和补帧模型,一键获得超补结果
AI 一键跑分一键查看设备 AI 性能数据模拟真实推理任务,统一量化推理任务,耗时越小越好
图片 OCR 识别图片转文字基于 Paddle-OCR-v3 模型,迄今最优秀的 OCR 识别模型、效果出众
视频字幕 OCR 提取硬字幕提取使用 PP-OCR 自动识别字幕位置及文字,输出字幕文件
视频上色老旧黑白照片或视频上色适合风景类黑白视频上色,推理速度快
人脸修复人脸照片修复可增强老旧照片、修复人脸,提高清晰度
目标检测图像检测和分割展示 AI 技术在通用场景下的检测、分割、追踪等效果
图像修复老旧照片修复可全身修复,也可只修复人脸,效果出众
视频转动漫风格迁移普通视频转换为动漫画风的视频
Whisper 语音识别支持十几种语言识别一键本地生成字幕
字幕翻译连续语境下的字幕翻译告别传统单条字幕翻译,连续语境更准确,支持 28 种语言互译
派蒙语音合成本地 tts约 800 多种语音,本地无限制合成

聚合版面向专业需求用户,付费只是为了持续产出优质 AI 应用。已开源的 20 个单独 APP 完全免费,各取所需,请勿喷我,如果项目帮到了你,不妨点个 Star。

部分截图

适配说明

本人开发环境为Windows系统,默认会发布WindowsLinux版本,得益于微软SandboxWSL2,可随时测试这些环境。为了拓展和持续产出优质又实用的 AI 生产力工具,现已上架“小白兔 AI”,欢迎大家助力开发者,推动人工智能的普及化。

社群交流

QQ 群:497556961

变更日志

查看

参考

Star History

Star History Chart