Paper2GUI: 开源人工智能技术工具箱

Paper2GUI: 一款面向普通人的AI桌面APP工具箱，免安装即开即用，已支持18+AI模型，内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等领域。支持Windows、Mac、Linux系统，未来还将适配安卓和苹果设备，另外还有小程序。

下载地址：Download

文字转语音工具，适用于配音、讲解、说书、广告等场景。

名称	大小	Model	下载
微软语音合成	5Mb	FastSpeech	Download
抖音火山语音	13Mb	Unkonw	Download
阿里云语音合成	13Mb	Unkonw	Download

视频超分工具，适用于720p或360p视频转1080p或4k视频,画质升级且不模糊，目前主要用于动漫视频超分。

名称	大小	Model	下载
RealESRGAN-GUI(RAM)	41.8Mb	RealESRGANv3	Download
waifu2x-GUI	38.9Mb	waifu2x	Download
RealESRGAN-GUI	28.8Mb	RealESRGANv2	Download
RealCugan-GUI	56.4Mb	RealCugan	Download
RealSR-GUI	94.5Mb	RealSR	Download

运动类视频流畅度升级工具，可以将低帧率30fps升级到60fps或360fps。适用于丝滑质感需求。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
RIFE-GUI(RAM)	51.2Mb	Rife					Download
DAIN-GUI	72.6Mb	Dain					Download

图像风格化，可以将照片转换为动漫风格、梵高风格、毕加索风格等等。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
AnimeGAN-GUI	8.9Mb	AnimeGANv2					Download

AI一键抠图，可生成透明图、绿幕、红幕、蓝幕等背景图片，头发丝处理良好，适合任意人物抠图需求。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
RVM-GUI	12.9Mb	rvm					Download

人像修复，可以将人像修复为清晰的图片，提升清晰度。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
GFPGAN-GUI	242Mb	GFPGAN					Download

视频抠图，利用RVM等算法，可实现无绿幕视频抠图，适合各种自媒体视频制作，节约大量时间。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
MODNet-GUI	77.5Mb	modnet					Download
MobileNetV2-GUI	34.6Mb	MobileNetV2					Download

适用范围太广，比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

名称	大小	Model	下载
YOLOv6-GUI	46Mb	yolov6n	Download
YOLOv5-GUI	60.2Mb	yolov5s	Download
YOLOX-GUI	50Mb	yolox_nano	Download

辅助工具，提供了一些常用的辅助工具，比如视频比对工具等。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
Video_compare	56.1Mb						Download

统一、全面、高效的小白兔AI，依赖强大的自研AI引擎，整合并持久优化，现已支持抠图、人像动漫化、动漫超分辨、音频降噪、语音合成、OCR识别等十余种AI功能，GPU加速推理，Inter、NVDIA、AMD全支持。

已内置功能	适用场景	功能简介
RealCugan-Pro动漫超分辨	动漫图片或视频超分辨放大	自研AI引擎驱动，可获得最高质量的动漫超分辨效果，可能是目前唯一可轻松使用RealCugan-Pro模型的软件
RealESRGAN动漫超分辨	动漫图片或视频	推理速度快，质量比waifu2x好太多，常规超分辨首选
智能抠图	任意图片或视频	推理速度快，一键获得透明图片或绿幕视，进行二次创作
人像动漫化	仅适合头像处理	转换效果出众，有趣又好玩
语音合成	自媒体视频配音、有声读书等	效果逼近真人，发音自然、带呼吸声、音色千变万化
录音降噪	真人配音后处理	一键去除环境和背景噪音，提升录音清晰度，效果明显
视频补帧	运动类视频流畅度升级工具	可获得丝滑观感，已支持RIFE和IFRNET两种AI模型
AI一键跑分	一键查看设备AI性能数据	模拟真实推理任务，统一量化推理任务，耗时越小越好
图片OCR识别	图片转文字	基于Paddle-OCR-v3模型，迄今最优秀的OCR识别模型、效果出众