python读取PDF文件并做词云可视化
Hallo,各位小伙伴大家好啊!这个专栏是用来分享数据处理以及数据可视化的一些常见操作,以及自己的一些学习笔记,希望能给大家带来帮助呀!感兴趣的小伙伴也欢迎私信或者评论区交流呀!Python编程读取至少一篇pdf文档。并编程实现以下功能:①实现其中的热词统计分析。②绘制热词统计分析的词云
一、PDF文档的选择我选择的PDF中文字内容如下:编辑
二、效果展示编辑编辑
三、完整代码12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455import pdfplumber # 导入库import jiebafrom wordcloud import WordCloudimport numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unico ...
一文解决Opencv四大经典算子——sobel算子、scharr算子、laplacian算子、canny算子
@toc边缘是像素值发生跃迁的位置,是图像的显著特征之一,在图像特征提取,对象检测,模式识别等方面都有重要的作用!
Sobel算子sobel算子对图像求一阶导数。一阶导数越大,说明像素在该方向的变化越大,边缘信号越强。因为图像的灰度值都是离散的数字, sobel算子采用离散差分算子计算图像像素点亮度值的近似梯度.soble x轴和y轴要分别计算,计算完用add添加在一起cv2.soble(image, ddepth,dx,dy,ksize)
image:需要处理的图片
ddepth: 输出图像的深度(可以理解为数据类型),-1表示与原图像相同的深度。
dx:0即为不计算,1即为计算
dy:同dy,0即为不计算,1即为计算。
ksize:卷积核的大小,为一个整数
值得注意的是ddepth在函数使用的时候经常会规定为cv2.CV_64F,与变化为绝对值函数cv2.convertScaleAbs一起配套使用。因为默认为-1的话,如果出现卷积核所在区域,左边为黑,右边为白,则会出现负数,opencv默认会进行截断操作,影响轮廓的显示。所有用cv2.CV_64F保留负数的像素 (如果此时 ...
基于Numpy数组的图像分割 基于PIL对图像进行拼接
目录一、要求二、代码三、程序解读
一、要求现在有一个多张图片构成的大图,要对图片进行分割和拼接。将下述图像分割成15个大小不同的子图像:编辑从中选择四个子图像,拼接成一个新得图像。例如:编辑
二、代码直接上代码:
123456789101112131415161718192021222324252627282930313233343536373839404142import cv2import numpy as npimport PIL.Image as Imagedef func(cut_width,cut_length,time,picture): (width, length, depth) = picture.shape # 预处理生成0矩阵 pic = np.zeros((cut_width, cut_length, depth)) # 计算可以划分的横纵的个数 num_width = int(width / cut_width) num_length = int(length / cut_length) # for循环迭代生成 ...
基于opencv的人脸检测
目录引言一、代码二、运行效果三、代码解读四、一些思考
引言这篇文章,让你用短短的16行代码基于opencv检测一张图片上的人脸,很有意思,快快学起来吧!
一、代码先将代码直接粘在下面:
123456789101112131415161718192021import cv2 as cvdef face_detect_demo(img): img = cv.resize(img, dsize=(800, 800)) gary = cv.cvtColor(img, cv.COLOR_BGR2GRAY) face_detect = cv.CascadeClassifier("D:/opencv/sources/data/haarcascades/haarcascade_frontalface_default.xml") face = face_detect.detectMultiScale(gary, 1.004, 28, 0, (40, 40), (50, 50)) for x, y, w, h in face: cv.r ...
神经网络对多变量的性别结果预测
神经网络这几年可谓是火得一塌糊涂,它是目前最为火热的研究方向——深度学习的基础。在神经网络刚被发明之初,人们欢呼雀跃,认为是创造出来了比人更强的思维怪兽。它类比于人的神经元的工作方式,通过信号传递,不断调整权重,最终输出结果!本文将根据一个多参数预测男女性别的实际案例向大家!
一、什么是神经网络?简而言之,神经网络就是函数:输入数据,输出结果!神经网络类似人类大脑,由一个个神经元组成,每个神经元和多个其他神元连接,形成网状。单个神经元只会解决最简单的问题,但是组合成一个分层的整体,就可以解决复杂问题。顾名思义,神经网络是类似于人脑神经元的一种东西。学过生物的我们都知道,神经元彼此之间相互联系,传入一个信号后,可以在神经元之间不断传递,最终促使肌体做出反应,比如被针扎了之后会马上缩手。你也可以笼统的认为神经网络就是一个函数,传入一个或多个参数后,经过一系列变换,输出一个或多个参数。最简单的以y=x+1为例,传入一个值就能输出一个值,当传入x=2的时候输出3,x=3的时候输出4。不过,真正的神经网络要复杂的多。想要继续深入学习可以参考:什么是神经网络?
二 ...
2022年度总结——一切都在慢慢变好
人生天地之间,若白驹过隙,忽然而已,每个人都希望留下自己的足迹。——题记
日月两盏灯,春秋一场梦。回想一年前的现在我在干什么呢?去年的寒假我刚步入大学一个学期,迷茫彷徨,怅然若失,为自己没有考上一个好学校而感到自责。大一上也很努力,每天早上都起的很早,六点不到就起床了,晚上十点图书馆关门才回宿舍,感觉和高中没什么两样,只不过高中是在教室里等老师来上课,大学是自己去不同的教室找老师上课。编辑大一上转了一次专业,进入了人工智能、机器人工程和智能制造联合培养的实验班,每天的课都很满,项目制课程也让刚步入大学的我很难适应,之前都是学习理论知识然后去考试,现在是先动手去做东西,遇到什么问题再去查资料。怎么说呢?这是学校第一年的创新吧,每天都沉浸在CAD画图,SW建模,优化方案,各种答辩的路上,学的基本上都是机械的知识,不感兴趣也学不明白。编辑唯一一门和编程相关的课就是C++,老师讲的很慢,难度也很大,讲到指针那里就听不懂了,然后稀里糊涂就结课了,但是那个老师给分真的很高,最后给了99分。编辑
舍一朝风月,得万古长空。想要学一门编程语言也是从大一上开始的,当时挑战杯开始报名,很多队伍在挑战杯群 ...