用Python和OpenCV实现照片马赛克拼图（蒙太奇照片）_机器学习马赛克照片拼接-程序员宅基地

技术标签：索引文件 python 下载图片 Photomosaic 蒙太奇照片 openCV 相片马赛克

https://www.bilibili.com/video/av39158788

马赛克拼图介绍：

相片马赛克（Photomosaic），或称蒙太奇照片、蒙太奇拼贴，是一种影像处理的艺术技巧，利用这个方式做出来的图片，近看时是由许多张小照片合在一起的，但远看时，每张照片透过光影和色彩的微调，组成了一张大图的基本像素，就叫做相片马赛克技巧。最先是由一个美国大学生发明的，但当时限于计算机性能，无法大量应用。（来源于维基百科相片相片马赛克）

这是最终得到的效果，如果你的图片集不同，或者参数设置不同，效果也会有差别。

基本原理：

对于要绘制的图的每一个像素，都在图像集中找和这个像素RGB值最接近的图像，然后放在这个位置。

下面是我的实现整个工程的步骤：

1，收集图片素材

要做出上述的效果来，首先就需要大量的图片，图片少了，效果肯定不好，容易重复，需要的像素值找不到相近的等等弊端。人工收集图片的话肯定是非常慢的，如果要手工下载图片，那至少要找图片找很多天了。这个时候一般有两个解决途径：

爬取图片

用网络爬虫从别的网站上爬取图片是个不错的选择，也可以用python来实现。

下载图片数据集

网络上有别人已经整理好的图像数据集，我使用的是斯坦福大学李飞飞制作的ImageNet数据集。这个数据集是计算机视觉领域常用的一种数据集，它的训练集大概有100多个G，测试集有10多个G，只是测试集就有10万张图片，够本工程使用了。所以我下载的是他的测试集。网速快的话可以十来分钟就下载下来。

图片数据集的迅雷下载链接

2，图片预处理

由于每张图片的大小不一致，拼图的时候不好处理，所以首先用OpenCV读取每个图片，再把它们的大小都改为100*100。一次更改，使用多次。代码如下：

#coding=utf-8
 
import os#和文件有关的模块
import cv2#OpenCV
 
#这里是10万张图片所在的文件夹，你可以按照你的路径改下面的代码。另外路径好像不支持中文字符。
readPath=r"f:\ILSVRC2012_img_test"
 
#这里是改变大小之后的图片，要保存的路径。save是一个文件夹
savePath=r"f:\save"
 
#用一个列表保存所有的图片的文件名字
files=os.listdir(readPath)
 
#n变量用来看到10万张图片的处理进度。
n=0
 
#遍历所有图片文件们
for file in files:
    n+=1
    imgPath=readPath+ "\\" + file#构造图片路径
    img=cv2.imread(imgPath)#读取图片到内存img变量
    img=cv2.resize(img,(100,100))#更改图片的大小
    # 更改之后写入文件，方便以后使用。否则你生成一张马赛克就要处理一次10万张图片
    cv2.imwrite(savePath+ "\\"+file,img)
    print(n)
    
cv2.waitKey()

3，建立索引

建立索引就是保存每张图片出现次数最多的像素值然后保存到文件中。格式为：

文件名称：B,G,R

建立好索引文件之后，就可以知道每个图片和他们最常见的颜色。在使用这些图片的时候，就可以读取整个索引文件，然后定位到图片文件本身。试想一下，如果没有这些索引文件，那么生成一次马赛克拼图就要求一次所有图片的最多像素，太多冗余了。下面是代码：

import cv2
import  os
import collections
 
readPath=r"f:\save"
files=os.listdir(readPath)
n=0
s=''
for file in files  :
    li=[]
    n+=1
    imgPath = readPath + "\\" + file
    img=cv2.imread(imgPath)
    for i in range(100):
        for j in range(100):
            b=img[i,j,0]
            g=img[i,j,1]
            r=img[i,j,2]
            li.append((b,g,r))
 
    most=collections.Counter(li).most_common(1)
    s += file
    s += ":"
    s += str(most[0][0]).replace("(","").replace(")","")
    s += "\n"
    print(n)
 
f = open('filename.txt','w')
f.write(s)

生成的索引文件格式是这样的：

4，画图

首先是读取步骤3生成的索引文件。然后可以选择打乱它，以免一样的图片聚集出现在一个位置附近。

假设目标图片是n*m的，那么新建一个n*100，m*100的图片（这里是100的整数倍是因为刚才把图片集中的每个图片都更改为100*100大小的了）。这是一个很大的图片。对于原图片的每个像素，都遍历索引文件，找到和BGR像素值的欧式距离（你也可以采取其他度量方式，甚至可以找最相近的图片，但这样将导致同图片的聚集，因为相邻的像素值很可能一样的）不大于一个阈值的索引文件中的值，然后根据找到的BGR定位到具体的文件，由文件再读取图片，把图片放到大图上的具体位置。下面是具体代码：

import  cv2
import numpy as np
 
readPath=r"f:\save"
 
def readIndex():
    fs = open("filename.txt","r")
    n=0
    dic=[]
    for line in fs.readlines():
        n+=1
        temp=line.split(":")
        file=temp[0]
        bgr=temp[1].split(",")
        b=int(bgr[0])
        g=int(bgr[1])
        r=int(bgr[2])
        dic.append((file,(b,g,r)))
    return dic
 
 
img=cv2.imread("york.jpg")
s=np.shape(img)
big= np.zeros((100*s[0], 100*s[1], 3), dtype=np.uint8)
 
list=readIndex()#读取索引文件到变量中
 
for i in range(s[0]):#遍历行和列
    for j in range(s[1]):
        print(i)
        b = img[i, j, 0]
        g = img[i, j, 1]
        r = img[i, j, 2]#获取图像当前位置的BGR值
        
        np.random.shuffle(list)#打乱索引文件
        
        for item in list:
            imgb=item[1][0]
            imgg=item[1][1]
            imgr=item[1][2]#获取索引文件的RGB值
            
            distance=(imgb-b)**2+(imgg-g)**2+(imgr-r)**2#欧式距离
            if distance<100:
                filepath=readPath+"\\"+str(item[0])#定位到具体的图片文件
                break
        little=cv2.imread(filepath)#读取整个最相近的图片
        big[i*100:(i+1)*100,j*100:(j+1)*100]=little#把图片画到大图的相应位置
 
cv2.imwrite("bigYork.jpg",big)#输出大图到文件中

大功告成。

下面是我的时间统计：

下载图片用了三个多小时
图片预处理用了一个多小时
建立索引大概需要一个多小时
之后画每个一万个像素点左右的图片大概需要三分钟的时间

其他链接

本文链接：https://blog.csdn.net/york1996/article/details/84489051

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

无名对象_class student{public:student(char* pname = "no nam-程序员宅基地

文章浏览阅读168次。代码：#include <iostream>#include <cstring> using namespace std;class Student{public:Student(char* pName="no name",int ssId=0){ strncpy(name,pName,40); name[39]='\0'; id = ssId; cout <&..._class student{public:student(char* pname = "no name"){strcpy(name, p

【Android自定义View】仿Photoshop取色器ColorPicker(二)_android 仿ps吸管效果-程序员宅基地

文章浏览阅读2.3k次。ColorPicker一款仿Photoshop取色器的Android版取色器。github地址：ColorPicker前言上一篇已经简单介绍了ColorPicker的项目结构以及两种颜色空间，接下来我们详细解析一下ColorPicker的核心自定义控件ColorPickerView。ColorPickerView在阅读代码之前，我们先看一下ColorPicker的布局以及一些标注的数值在代码里的变量_android 仿ps吸管效果

计算机系统结构复习（一）：Introduction概述_data-level parallelism-程序员宅基地

文章浏览阅读1.2k次，点赞2次，收藏4次。计算机系统结构复习（一）：Introduction概述体系结构发展新趋势定量分析/量化研究方法计算机种类摩尔定律什么是计算机系统结构两个概念计算机系统结构与计算机组成、实现的关系体系结构发展新趋势1.新的模型：Data-level parallelism (DLP)：数据级并行Thread-level parallelism (TLP)：线程级并行Request-level parallelism (RLP)：满足用户需求的并行2.开源架构 RISC-V3.Domain-Specific A_data-level parallelism

surface pro 4 wifi掉线问题-程序员宅基地

文章浏览阅读897次。更新你的无线网卡驱动到最新版本15.68.9032.47，重启。或者运行regedit修改注册表 HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\mrvlpcie8897，找到值 “TXAMSDU”把它从1改为0。转载于:https://www.cnblogs.com/misstaste/p/5898571.html..._surface pro 4 无线网卡

不断更新中:中文垃圾邮件过滤规则集Chinese_rules.cf_spamassassin 中文规则-程序员宅基地

文章浏览阅读4.2k次。Chinese_rules.cf的使用方法:下载Chinese_rules.cf，把该规则放在SpamAssassin存放规则的目录(一般在/usr/share/spamassassin或/usr/local/etc/mail/spamassassin)。通过wget下载的命令如下：wget -N -P /usr/share/spamassassin www.service-labs.com/dow_spamassassin 中文规则

mysql基础知识：sql通用语法，及分类（mysql学习纪念）-程序员宅基地

文章浏览阅读349次，点赞10次，收藏11次。2.SQL语句可以使用空格/缩进来增强语句的可读性。1.SQL语句可以单行或多行书写，以分号结尾。3.MySQL数据库的SQL语句不区分大小写。

随便推点

matlab快速入门（7):创建等间距向量_matla间隔相等的向量-程序员宅基地

文章浏览阅读3.8k次，点赞4次，收藏4次。(1)我们经常需要创建一些包含等间距数值的向量，例如以下向量。y = [5 6 7 8]y = 5 6 7 8任务:创建一个名为x(2)对于长向量，输入单个数值是不实际的。可用来创建等间距向量的替代便捷方法是使用:运算符并仅指定起始值和最终值。y = 5:8y = 5 6 7 8请注意，当您使用冒号运算符时，不需要方括..._matla间隔相等的向量

Git的相关操作，创建、更新、提交等，代码托管在码云上_使用git提交代码,git commit -m ' ' 提交、同步代码之后,在码云上备注是乱码。怎-程序员宅基地

文章浏览阅读5.9k次。Git的相关操作，创建、更新、提交等，代码托管在码云上一、环境配置：（1）下载安装Git Bash，具体步骤就不赘述了；（2）双击运行“Git Bash”，配置用户名及邮箱：$ git config --global user.name "xxxxxxx"$ git config --global user.email "[email protected]"_使用git提交代码,git commit -m ' ' 提交、同步代码之后,在码云上备注是乱码。怎

Java多线程之线程池深入分析（下）_线程之 1.7 doacquiresharedinterruptibly解析-程序员宅基地

文章浏览阅读1.4k次。一、数据结构与线程构造方法由于已经看到了ThreadPoolExecutor的源码，因此很容易就看到了ThreadPoolExecutor线程池的数据结构。图1描述了这种数据结构。图1 ThreadPoolExecutor 数据结构其实，即使没有上述图形描述ThreadPoolExecutor的数据结构，我们根据线程池的要求也很能够猜测出其数据结构出来。_线程之 1.7 doacquiresharedinterruptibly解析

JS快速获取图片宽高的方法_图片 src和onload 哪个快-程序员宅基地

文章浏览阅读4.8w次，点赞3次，收藏21次。快速获取图片的宽高其实是为了预先做好排版样式布局做准备，通过快速获取图片宽高的方法比onload方法要节省很多时间，甚至一分钟以上都有可能，并且这种方法适用主流浏览器包括IE低版本浏览器。我们一步一步进入这个过程。一、简陋的获取图片方式1234567891011_图片 src和onload 哪个快

严重: 在路径为/book的上下文中，Servlet[jsp]的Servlet.service（）引发了具有根本原因的异常java.lang.ClassNotFoundException: org.a_严重: 在路径为/bookmanage的上下文中,servlet[jsp]的servlet.serv-程序员宅基地

文章浏览阅读6.3k次。严重: 在路径为/book的上下文中，Servlet[jsp]的Servlet.service（）引发了具有根本原因的异常java.lang.ClassNotFoundException:这种报错，除了其他人的：还有一种可能：名字不一样，哪怕是空格哪怕是一个空格！..._严重: 在路径为/bookmanage的上下文中,servlet[jsp]的servlet.service()引发了具

ios砸壳_ios砸壳需要闪退怎么砸-程序员宅基地

文章浏览阅读6.2k次。frida-ios-dump源码地址:GitHub - AloneMonkey/frida-ios-dump: pull decrypted ipa from jailbreak devicefrida-ios-dump是基于frida开发的一键砸壳工具，需要配置frida环境手机配置1）越狱状态2）安装openssh3）安装fridaMac配置1）安装frida，命令行:sudo pip install frida-tools （没有安装pip的话需要先安装pip）_ios砸壳需要闪退怎么砸