视觉分析之边缘检测算法

news/2025/2/22 1:45:54

9.1 Roberts算子

Roberts算子又称为交叉微分算法,是基于交叉差分的梯度算法,通过局部差分计算检测边缘线条。

常用来处理具有陡峭的低噪声图像,当图像边缘接近于正45度或负45度时,该算法处理效果更理想。

其缺点是对边缘的定位不太准确,提取的边缘线条较粗。

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt 
 
# 读取图像
img = cv.imread('bridge.png', cv.COLOR_BGR2GRAY)
# cv.COLOR_BGR2GRAY将BGR图像转换为灰度图像
rgb_img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
 
# 灰度化处理图像
grayImage = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
 
# Roberts算子的两个卷积核kernelx和kernely,分别用于检测水平和垂直方向的边缘。
kernelx = np.array([[-1, 0], [0, 1]], dtype=int)
kernely = np.array([[0, -1], [1, 0]], dtype=int)
 
# 使用cv.filter2D函数对灰度图像进行卷积操作,得到水平和垂直方向的梯度图像。
x = cv.filter2D(grayImage, cv.CV_16S, kernelx)
y = cv.filter2D(grayImage, cv.CV_16S, kernely)
 
# 将卷积后的图像数据转换为绝对值,并转换为uint8类型,以便于显示。
absX = cv.convertScaleAbs(x)
absY = cv.convertScaleAbs(y)
# 将两个方向的梯度图像融合,得到最终的Roberts算子边缘检测图像。
Roberts = cv.addWeighted(absX, 0.5, absY, 0.5, 0)
 
# 显示图形
titles = ['src', 'Roberts operator']
images = [rgb_img, Roberts]
 
for i in range(2):
    # 使用matplotlib的subplot和imshow函数显示原始图像和Roberts算子处理后的图像
    plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()
 
 

Sobel算子边缘检测
Sobel算子(索贝尔算子)利用像素上、下、左、右邻域的灰度加权算法,根据在边缘点处达到极值这一原理进行边缘检测。

该方法不但产生较好的检测效果,而且对噪声具有平滑作用,可以提供较为精确的边缘方向信息。缺点是Sobel算子并没有将图像的主题和背景严格区分开。

使用Sobel边缘检测算子提取图像边缘的过程大致可以分为以下三个步骤:

提取x方向的边缘,x方向一阶Sobel边缘检测算子如下图1所示;
提取y方向的边缘,y方向一阶Sobel边缘检测算子如下图2所示;
综合两个方向的边缘信息得到整幅图像的边缘。

import cv2 as cv
import matplotlib.pyplot as plt
 
# 读取图像
img = cv.imread('bridge.png', cv.COLOR_BGR2GRAY)
rgb_img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
 
# 灰度化处理图像
grayImage = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
 
# 使用cv.Sobel函数计算图像的水平和垂直方向的梯度
# cv.CV_16S指定数据类型为16位有符号整数。
x = cv.Sobel(grayImage, cv.CV_16S, 1, 0)
y = cv.Sobel(grayImage, cv.CV_16S, 0, 1)
 
# 将计算得到的梯度图像转换为绝对值,并转换为uint8类型,以便显示。
absX = cv.convertScaleAbs(x)
absY = cv.convertScaleAbs(y)
# 将水平和垂直方向的梯度图像融合,得到最终的Sobel算子边缘检测图像。
Sobel = cv.addWeighted(absX, 0.5, absY, 0.5, 0)
 
# 用来正常显示中文标签
plt.rcParams['font.sans-serif'] = ['SimHei']
 
# 显示图形
titles = ['原始图像', 'Sobel 算子']
images = [rgb_img, Sobel]
 
for i in range(2):
    plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])

plt.show()

示例:

LoG边缘检测算子
该算法首先对图像做高斯滤波,然后求其拉普拉斯(Laplacian)二阶导数,即图像与Laplacian of the Gaussian function 进行滤波运算。

LoG算子也就是高斯拉普拉斯函数,常用于数字图像的边缘提取和二值化。首先对原始图像进行最佳平滑处理,最大限度地抑制噪声,再对平滑后的图像求取边缘。

该算法的主要思路和步骤:滤波、增强、检测。

import cv2 as cv
import matplotlib.pyplot as plt
 
# 读取图像
img = cv.imread("bridge.png")
rgb_img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
 
gray_img = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
 
# 先通过高斯滤波降噪
gaussian = cv.GaussianBlur(gray_img, (3, 3), 0)
 
# 再通过拉普拉斯算子做边缘检测,cv.Laplacian函数计算图像的二阶导数
dst = cv.Laplacian(gaussian, cv.CV_16S, ksize=3)
LOG = cv.convertScaleAbs(dst)
 
# 用来正常显示中文标签
plt.rcParams['font.sans-serif'] = ['SimHei']
 
# 显示图形
titles = ['原始图像', 'LOG 算子']
images = [rgb_img, LOG]
 
for i in range(2):
    plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

示例:


http://www.niftyadmin.cn/n/5861503.html

相关文章

数字人面试

rnn作用 循环神经网络(RNN)是一种深度学习模型,特别适用于处理序列数据。以下是RNN的主要作用: 序列建模:RNN能够处理任意长度的序列数据,这使得它们在时间序列分析、语音识别、语言模型等任务中非常有用。…

2025最新面试自用题库---面试使用

2025最新面试自用题库---面试使用 1、css中如何实现水平垂直居中方法一:flex:方法二:绝对定位margin:auto:方法三:已知子元素宽高(200*200) 绝对定位 负margin方法四:已知子元素宽高(200*200) 绝对定位 calc方法五…

[AI相关]生成视频-第一个项目,20k星开源MoneyPrinterTurbo

还是之前文章介绍过地几个工具之一 [AI相关]各平台AI使用对比,包含大模型学习,生成视频等-CSDN博客 问问AI其结构,框架等,虽然不太完全对,但真地DeepSeek已经回答得很好了: 重点关注就两个类 video_eng…

JavaE E基础之 Tomcat与Http (上)

目录 1.Java WEB前奏 1.1. C/S 结构 1.2. B/S 结构 1.3. 静态网页和动态网页 1.4. 常见的网页 1.5. Web 服务器 2. Tomcat 安装(熟练) 2.1. Tomcat 概述 2.2. Tomcat 的作用 2.3 Tomcat 安装 2.4. Tomcat 测试 3. Tomcat 分析(熟练) 3.1. Tomcat 目录结构 3.2. Tomc…

Linux----Makefile基础

Makefile 是自动化构建工具 make 的配置文件,用于定义编译规则和依赖关系,实现高效增量编译。 初识makefile 1. 什么是 make? 定义: make 是一个命令行工具(可执行程序),用于解析并执行 Makef…

Ubuntu 22.04 一键部署MinerU1.1.0

MinerU MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发…

VSCode集成deepseek使用介绍(Visual Studio Code)

VSCode集成deepseek使用介绍(Visual Studio Code) 1. 简介 随着AI辅助编程工具的快速发展,VSCode作为一款轻量级、高度可扩展的代码编辑器,已成为开发者首选的工具之一。DeepSeek作为AI模型,结合Roo Code插件&#x…

后端开发:开启技术世界的新大门

在互联网的广阔天地中,后端开发宛如一座大厦的基石,虽不直接与用户 “面对面” 交流,却默默地支撑着整个互联网产品的稳定运行。它是服务器端编程的核心领域,负责处理数据、执行业务逻辑以及与数据库和其他后端服务进行交互。在当…