计算机毕业设计--基于深度学习的图像修复(清晰化+划痕修复+色彩增强)算法设计与实现(含Github代码+GUI+Web端在线体验界面)
计算机毕业设计-基于深度学习的老(旧)照片色彩复原、上色算法模型设计与实现(对抗生成式网络GAN、含Github代码与Web端设计)
更多基于深度学习的毕业设计请关注专栏 --- 深度学习相关计算机毕业设计
- 作者正忙,稍后上传
👇
Web端在线体验地址:✅访问这里进行图像修复在线体验✅
在线体验地址已经集成了训练好的模型,您只需点击选择使用的模型即可!
☝
本项目为您提供了该项目可用的开题报告与任务书供免费下载使用(开题报告不查重)
📦:图像修复论文可用开题报告&&
任务书下载链接:
通过网盘分享的文件:破损图像修复开题报告&&任务书.doc
链接: https://pan.baidu.com/s/1O0XpRSZqpI618cx3PnEBOA?pwd=4pfg 提取码: 4pfg
在线体验使用方式:
打开连接后,左侧两个图片输入框分别需要上传待修复的原图和代表原图上破损位置的Mask。在网页下方提供了四组输入样例,点击样例自动填充到相应位置后即可点击开始修复查看效果。
注意: 修复第一张图的时候耗时较长,大约10秒左右。从第二张图开始,速度就会快起来,大约5秒左右一张(这主要是因为为了节约服务器资源,第一次启动的时候模型需要加载进显卡中)
提示: 本科生做深度学习毕业设计是比做一个系统更容易通过答辩与毕业的,学校对本科生掌握深度学习知识的程度不高,只需要能大致讲述出模型的设计流程,并在论文中写清楚即可。 另外,本科生做深度学习的项目一般不能纯做算法(因为老师清楚本科生并不具备单独研究算法的能力),所以应该以算法+应用为主,因此一定需要一个为算法配套的可视化交互程序(Web端或者GUI桌面应用程序)。该项目设计了GUI和Web页面两种配套应用,一般来说,选择其一就可以。
通过网盘分享的文件:破损图像修复开题报告&&任务书.doc
链接: https://pan.baidu.com/s/1O0XpRSZqpI618cx3PnEBOA?pwd=4pfg 提取码: 4pfg
在图像获取和传输过程中,往往伴随着各种形式的损坏,降低了图像质量和对图像信息的准确解释,一些老照片因为保存不当也会变得存在污渍或者破损缺失。图像修复技术主要用来修复日常生活中被噪声污染或者人为破坏的破损图像,也可应用于替换图像中的小区域或者瑕疵。目前,图像修复工作仍然由经验丰富的图像修复师来完成,让图像修复借助深度学习算法实现自动化日趋成为该领域的发展方向。本课题基于深度学习算法和图像处理技术,设计并开发一款图像修复深度学习算法程序,该算法能够对使用者上传的照片进行自动化分析,修复照片的损坏部分,提高照片的清晰度和观赏性。
最近的研究表明,在图像修复问题中建立远程相互作用模型具有很高的重要性。为了实现这一目标,现有的方法要么利用独立注意力技术,要么利用Transformer
。但是,考虑到计算成本,并且通常需要修复低分辨率下的图像。本课题提出了一种新的面向预测像素的Transformer
结构模型,结合卷积的上下采样和图像风格迁移技术来实现缺失或者模糊图像的修复。
模型由卷积头
、GAN
模块、Transformer
模块、卷积尾和风格迁移模块组成。 卷积头负责从输入图像和掩码中提取视觉标记。它包括四个3*3
卷积,用于更改图像维度和下采样。GAN
和Transformer
是模型的主要组成部分,由五个不同分辨率的Transformer
组成(内嵌五对GAN
编解码器)从而使用多头情境注意力对长距离互动进行建模。 卷积尾用于对输出标记的空间分辨率进行上采样以匹配输入大小。风格迁移模块旨在实现多元化生成并增强输出的多样性,它通过使用额外的噪声输入在重建过程中更改卷积层的权重归一化来操纵输出。此外,该模块还结合了图像条件样式和无噪声样式,以增强噪声输入的表示能力。
该项目基于训练完成的模型,开发了两种不同的交互系统界面。分别是可打包为.exe
文件的基于QT
开发的GUI
界面(如下图所示),以及一个Web前后端项目(Web端样式同在线体验连接)。
- 包括
SSIM(Structural Similarity)
结构相似性指标、PSNR(Peak signal-to-noise ratio)
峰值信噪比、PID
、UID
指标以及训练过程中Acc和Loss的评估。如果你是在私有数据集上训练的模型,那么上述测试数据需要在自己训练过的模型上才能完成指标测试,相关测试请联系作者(联系方式见文末)
- 运行算法与Web前端需要
Python >= 3.9
- 运行GUI界面需要下载Qt Create编译器
5.14.2
版本 - 我提供在
CelebA-HQ
和Places2
数据集训练好的两个模型,建议使用带有Nvidia(英伟达)系列的显卡(例如常见的GeForce 1060、3050、3090、4090、5060等都是Nvidia系列的) - 如果电脑没有合适的显卡也可使用该模型(需通过内存加载模型并丢给CPU进行推理计算,推理速度会慢很多)
📦:训练人脸修复模型的数据集CelebA-HQ
在这里下载(也可以换用其他图片进行测试,但选择使用数据集中的4万张图进行测试效果最好)
百度网盘分享的文件
链接:https://pan.baidu.com/s/1f8v6-OQsK_6YHvlvTvovGQ?pwd=khgb
提取码:khgb
📦:用于辅助图片修复的Mask在这里下载(必须使用Mask
,Mask
的作用是告知模型图片破损的位置)
百度网盘分享的文件
链接:https://pan.baidu.com/s/1Det77BagB6Xm3LdKG1_JFA?pwd=zz1k
提取码:zz1k
# 从github上Clone项目(需要你安装了git工具)
git clone https://github.com/zxx1218/image_fix.git
# 使用conda创建环境
conda create -n imgfix python=3.8
conda activate imgfix
# 安装依赖
pip install -r requirements.txt
# 联系作者咨询,联系方式在文末
* 效果同上述在线体验连接
部署好项目后启动web
端使用如下命令(会启动在127.0.0.1:xxxx
的本机环回地址下,图中示例为9091端口)
python gradio_demo.py
回车后会自动启动Web服务,在控制台看到如下信息代表成功启动,在浏览器打开弹出的URL即可👇
注:项目也支持进行基于Python的FastApi后端服务部署(针对Web服务器部署)。如有需要,联系作者,联系方式在文末
使用Qt Create编译器运行QT代码即可直接使用(SQLlite数据库为代码内嵌,无需特别配置),启动后首先经过注册与登录界面,登录后效果如下图
- 上传mask位置有用户选择mask后,会自动覆盖在原图上,并显示为原图覆盖mask后的结果)
- 设计了根据不同登录用户的用户历史修图记录查询功能
执行如下命令:
# 首先cd到算法代码imf_fix根目录下
cd img_fix
# 将待修复图片放在文件夹/test_sets下
(略)
# 执行generate_image.py文件(这里需要根据您的修复需求添加相关参数)
python generate_image.py --参数1 --参数2 --参数n
控制台显示如下日志信息代表批量修图成功👇
视频中上传的黑白图中黑色部分代表图片的破损位置(V2.0版本中上传的mask会覆盖在原图上进行显示。视频中演示的是V1.0版本),模型会将黑白图完全覆盖在原图上通过未破损位置对破损位置进行修复
- 由于github上传视频受限,观看演示视频请移步至我的CSDN观看,连接:https://blog.csdn.net/qq_45566099/article/details/134942373
PS:2025.1.16 QT界面已经升级到V2.0版本,提供了内嵌的sellite轻量级数据库支持(使用无需额外配置)以及GUI界面的美化(主要为mask上传后显示为在原图上的覆盖),并添加了用户历史修图记录查询功能。
Web端在线体验地址:
- 由于github上传视频受限,观看演示视频请移步至我的CSDN观看,连接:https://blog.csdn.net/qq_45566099/article/details/134942373
- 由于github上传视频受限,观看演示视频请移步至我的CSDN观看,连接:https://blog.csdn.net/qq_45566099/article/details/134942373
- 训练自己想要的定制化图像修复模型只需要准备好针对需要修复图片的同类型图片数据即可,具体训练方式请咨询作者
-
VX:Accddvva
-
QQ:1144968929
-
Github提供训练好的模型文件以及调用该文件进行修图的测试代码(Github开源代码中不含模型定义源码、训练代码以及QT的桌面端GUI代码,提供可供测试的模型文件,拉取Git代码后安装环境可进行修图测试)
-
该项目完整代码 + 详细环境配置(如有需要可提供模型远程部署)+ GUI界面 + Web端 + 训练方式 == 价格300RMB
-
如果你的电脑没有合适的GPU,或需要自行训练私有数据而自己的GPU显存不够,作者另提供GPU服务器短期(3个月内)免费使用服务,免费提供24G显存+64G内存云服务器(可使用Vscode、OpenSSH、PuTTY、Xshell、SecureCRT、MobaXterm等远程工具连接)
- 人脸(提供训练过的模型文件)公开数据集CelebA-HQ:链接:https://github.com/tkarras/progressive_growing_of_gans 制作机构:Tero Karras, Samuli Laine, Timo Aila 和 NVIDIA 的研究人员制作-内含约4万张训练图片
- 自然场景(提供训练过的模型文件)公开数据集Places2:链接:http://places2.csail.mit.edu/download.html 制作机构:斯坦福大学和微软研究院共同制作-内含180万张训练图片
- 街景公开数据集Paris StreetView:链接:http://opendata.paris.fr/explore/dataset/photos-de-rue-a-paris/ 制作机构:巴黎市政府
- 文理公开数据集DTD:链接:http://www.robots.ox.ac.uk/~vgg/data/dtd/。 制作机构:英国牛津大学计算机视觉研究团队
- 建筑公开数据集Façade:链接: GitHub上的项目:https://github.com/shannontian/facade-parsing 官方网站:CMP Facade Database 数据集共享平台:https://www.vision.ee.ethz.ch/datasets_extra/facade/ 制作机构:Czech Technical University in Prague (捷克技术大学)
- 作者于浙江某985高校就读人工智能方向研究生(CSDN已认证),可以定制模型,并提供相应技术文档以及各种需要,只需要描述需求即可
- 人工智能、深度学习领域,尤其是计算机视觉(Computer vision,CV)方向的模型or毕业设计,只要你想得出,没有做不出