欢迎光临
我们一直在努力

Paper2GUI: 开源人工智能技术工具箱

Paper2GUI: 一款面向普通人的AI桌面APP工具箱,免安装即开即用,已支持18+AI模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等领域。支持Windows、Mac、Linux系统,未来还将适配安卓和苹果设备,另外还有小程序。

下载地址:Download

已发布内容

文字转语音工具,适用于配音、讲解、说书、广告等场景。

名称 大小 Model 多语言 Windows Mac Linux 下载
微软语音合成fire 5Mb FastSpeech white_check_mark white_check_mark white_check_mark white_check_mark Download
抖音火山语音fire 13Mb Unkonw black_square_button white_check_mark white_check_mark white_check_mark Download
阿里云语音合成 13Mb Unkonw black_square_button white_check_mark white_check_mark white_check_mark Download

视频超分工具,适用于720p或360p视频转1080p或4k视频,画质升级且不模糊,目前主要用于动漫视频超分。

名称 大小 Model 多语言 Windows Mac Linux 下载
RealESRGAN-GUI(RAM)fire 41.8Mb RealESRGANv3 white_check_mark white_check_mark black_square_button black_square_button Download
waifu2x-GUI 38.9Mb waifu2x hourglass_flowing_sand white_check_mark black_square_button black_square_button Download
RealESRGAN-GUI 28.8Mb RealESRGANv2 black_square_button white_check_mark black_square_button black_square_button Download
RealCugan-GUI 56.4Mb RealCugan black_square_button white_check_mark black_square_button black_square_button Download
RealSR-GUI 94.5Mb RealSR black_square_button white_check_mark black_square_button black_square_button Download

运动类视频流畅度升级工具,可以将低帧率30fps升级到60fps或360fps。适用于丝滑质感需求。

名称 大小 Model 多语言 Windows Mac Linux 下载
RIFE-GUI(RAM)fire 51.2Mb Rife white_check_mark white_check_mark black_square_button black_square_button Download
DAIN-GUI 72.6Mb Dain black_square_button white_check_mark black_square_button black_square_button Download

图像风格化,可以将照片转换为动漫风格、梵高风格、毕加索风格等等。

名称 大小 Model 多语言 Windows Mac Linux 下载
AnimeGAN-GUIfire 8.9Mb AnimeGANv2 white_check_mark white_check_mark black_square_button black_square_button Download

AI一键抠图,可生成透明图、绿幕、红幕、蓝幕等背景图片,头发丝处理良好,适合任意人物抠图需求。

名称 大小 Model 多语言 Windows Mac Linux 下载
RVM-GUIfire 12.9Mb rvm black_square_button white_check_mark black_square_button black_square_button Download

人像修复,可以将人像修复为清晰的图片,提升清晰度。

名称 大小 Model 多语言 Windows Mac Linux 下载
GFPGAN-GUIfire 242Mb GFPGAN white_check_mark white_check_mark black_square_button black_square_button Download

视频抠图,利用RVM等算法,可实现无绿幕视频抠图,适合各种自媒体视频制作,节约大量时间。

名称 大小 Model 多语言 Windows Mac Linux 下载
MODNet-GUIfire 77.5Mb modnet black_square_button white_check_mark black_square_button black_square_button Download
MobileNetV2-GUIfire 34.6Mb MobileNetV2 black_square_button white_check_mark black_square_button black_square_button Download

适用范围太广,比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

名称 大小 Model 多语言 Windows Mac Linux 下载
YOLOv6-GUI 46Mb yolov6n white_check_mark white_check_mark black_square_button black_square_button Download
YOLOv5-GUI 60.2Mb yolov5s white_check_mark white_check_mark black_square_button black_square_button Download
YOLOX-GUI 50Mb yolox_nano white_check_mark white_check_mark black_square_button black_square_button Download

辅助工具,提供了一些常用的辅助工具,比如视频比对工具等。

名称 大小 Model 多语言 Windows Mac Linux 下载
Video_comparefire 56.1Mb white_check_mark black_square_button black_square_button Download

统一、全面、高效的小白兔AI,依赖强大的自研AI引擎,整合并持久优化,现已支持抠图、人像动漫化、动漫超分辨、音频降噪、语音合成、OCR识别等十余种AI功能,GPU加速推理,Inter、NVDIA、AMD全支持。

已内置功能 适用场景 功能简介
RealCugan-Pro动漫超分辨 动漫图片或视频超分辨放大 自研AI引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用RealCugan-Pro模型的软件
RealESRGAN动漫超分辨 动漫图片或视频 推理速度快,质量比waifu2x好太多,常规超分辨首选
智能抠图 任意图片或视频 推理速度快,一键获得透明图片或绿幕视,进行二次创作
人像动漫化 仅适合头像处理 转换效果出众,有趣又好玩
语音合成 自媒体视频配音、有声读书等 效果逼近真人,发音自然、带呼吸声、音色千变万化
录音降噪 真人配音后处理 一键去除环境和背景噪音,提升录音清晰度,效果明显
视频补帧 运动类视频流畅度升级工具 可获得丝滑观感,已支持RIFE和IFRNET两种AI模型
AI一键跑分 一键查看设备AI性能数据 模拟真实推理任务,统一量化推理任务,耗时越小越好
图片OCR识别 图片转文字 基于Paddle-OCR-v3模型,迄今最优秀的OCR识别模型、效果出众

软件现已支持手动调整并发数,可根据设备显卡体质自行调整,实现GPU的最大化利用率,因此不论是笔记本低端显卡还是RTX 3090TI都能充分释放设备性能。

开发者计划:

  • AI新功能:语音识别、视频字幕提取、人脸修复、旧图片上色修复、多目标抠图等等
  • 跨端支持:Windows、Mac、Colab、WASM
  • 待突破:disco diffusion、deepfake、人声+背景音乐分离

部分截图

适配说明

本人开发环境为Windows系统,默认会发布WindowsLinux版本,得益于微软SandboxWSL2,可随时测试这些环境。Mac版需要主动参与反馈。为了拓展和持续产出优质又实用的AI生产力工具,现已上架“小白兔AI”,欢迎大家助力开发者,推动人工智能的普及化。

 

 

 

赞(0)
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!