甜不辣2000
全职 · 300/日  ·  6525/月
工作时间: 工作日10:00-20:00、周末00:00-00:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

何光宇,22,贵州贵阳,爱好摄影,自学python


工作经历

  • 2020-06-23 -2022-07-07自由职业独立约拍摄影师

    网络平台接单,独立约拍摄影师,人像,个人写真,街拍,港风,由于疫情原因,市场生意不景气,在家待业学习爬虫

教育经历

  • 2015-06-10 - 2018-08-15亚泰学院平民设计高中

技能

0
1
2
3
4
5
作品
python抓取正文示范

importredefremove_js_css (content):"""remove the the javascript and the stylesheet and the comment content ( and )"""r= re.compile(r'''''',re.I|re.M|re.S) s= r.sub ('',content) r= re.compile(r'''''',re.I|re.M|re.S) s= r.sub ('', s) r= re.compile(r'''''', re.I|re.M|re.S) s= r.sub('',s) r= re.compile(r'''''', re.I|re.M|re.S) s= r.sub('',s)r= re.compile(r'''''', re.I|re.M|re.S) s= r.sub('',s)returnsdefremove_empty_line (content):"""remove multi space"""r= re.compile(r'''^\s+$''', re.M|re.S) s= r.sub ('', content) r= re.compile(r'''\n+''',re.M|re.S) s= r.sub('\n',s)returnsdefremove_any_tag (s): s= re.sub(r''']+>''','',s)returns.strip()defremove_any_tag_but_a (s): text= re.findall (r''']*>(.*?)''',s,re.I|re.S|re.S) text_b=remove_any_tag (s)return len(''.join(text)),len(text_b)def remove_image (s,n=50): image= 'a' *n

0
2023-04-13 19:08
爬虫获取内容正文

实现代码:#coding:utf-8 import re def remove_js_css (content): """ remove the the javascript and the stylesheet and the comment content ( and ) """ r = re.compile(r'''''',re.I|re.M|re.S) s = r.sub ('',content) r = re.compile(r'''''',re.I|re.M|re.S) s = r.sub ('', s) r = re.compile(r'''''', re.I|re.M|re.S) s = r.sub('',s) r = re.compile(r'''''', re.I|re.M|re.S) s = r.sub('',s) r = re.compile(r'''''', re.I|re.M|re.S) s = r.sub('',s) return s def remove_empty_line (content): """remove multi space """ r = re.compile(r'''^\s+$''', re.M|re.S) s = r.sub ('', content) r = re.compile(r'''\n+''',re.M|re.S) s = r.sub('\n',s) return s

0
2023-04-13 19:13
python学习笔记

Python 转义字符 \n 换行 \t 空四格 \r 删除前面内容 \b 退一个格 R 不希望字符串中的转义字符起作用,就在字符串之前加上r 数据类型 整数类型 int 浮点数类型 float 布尔类型 bool 【true 是】【 false 否】 字符串类型 str ——————————————————————————— 整数类型 二进制 0b开头 八进制 0o开头 十六进制 0x开头 ——————————————————————————— 字符串类型 单引号只能在一行实现 ’ ’ 双引号只能在一行实现 “ ” 三引号可以换行实现 ‘’‘ ’‘’ —————————————————————————— 函数 int Float转成int类型,截取整数部分,舍掉小数部分 小数串不能将str转成int类型 将str转成int类型时,字符必须为数字串(整数) 将int类型通过str()函数转成str类型 float 字符串的数据如果是非数字串,则不允许转换 将其他数据类型转成浮点数 整数转成浮点数,末尾为.0 present 变量 = 赋值运算符 input ()函数是一个输入函数 需要回答问题 ———————————————————————— 算术运算符 + 加法运算 - 减法运算 *乘法运算 / 除法运算 // 整除运算 % 取余运算 公式 余数=被除数-除数*商 ** 2的2次方 (2**3) 2的3次方 ————————————————————————— 比较运算符 > > >= true true and false —>false false and true —>false false and false —>false Or True or True —>True True or False —>True False or True —>True False or False —>False Not 对bool类型操作数取反 True取反False False取反True —————————————————————————— 运算符 位运算 将数据转成二进制进行计算 位与& 对应数位都是1,结果数位才是1,否则为0 位与| 对应数位都是0,结果数位才是0,否则为1 左移位运算符> 低位溢出舍弃,高位补0 (向左移动一个位置)相当于乘以2 (向右移动一个位置)相当于除以2 ——-——————————-———————————————— 对象的布尔值 Bool print(bool(0))#False 「False」 print(bool(set())) #False 0 0.0 None ‘’ ‘’’’ [] 空列表 list() 空列表 () 空元组 tuple() 空元组 {} 空字典 Set() 空集合 ——————————————————————————— 对象的布尔值 除开以上布尔值其他都是True True —————————————————-—————————-———— 分支结构 嵌套 语法结构 elif 条件执行体 If 条件表达式 else 条件执行体 _____________________________ Pass 语句 什么都不做 只是一个占位符 用到需要写语句的地方 ————-——————————————————- range 函数的使用 #range()的三种创建方式 range 产生一个整数序列,也是一个可迭代对象 for _ in range 如果在循环体中不需要使用到自定义变量,可将自定义变量写为“_” start 开始 stop 结束 Step 步长多少 ‘’‘第一种创建方式,只有一个参数(小括号中只给了一个数)’‘’ r=range(10) print(r) print(list)(r)) 默认从0开始,默认相差1称为步长 List 用于查看range对象中的整数序列 list (列表的意思) 第二种创建方式,给了两个参数(小括号中给了两个数) r=range(1,10) print(list(r)) run 1,2,3,4,5,6,7,8,9 第三种创建方式,给了三个参数(小括号中给了三个数) r=range(1,10,2) print(list(r)) run 1,3,5,7,9 循环结构 while 条件表达式 if是判断一次,条件为True执行一行 while是判断N+1次,条件为True执行N次 4步循环法 初始化变量 条件判断 条件执行体(循环体) 改变变量 总结:初始化的变量与条件判断的变量与改变的变量为同一个 for- in 循环 In表达从(字符串、序列等)中依法取值 Pwd 密码缩写 break 如果用于循环则终止循环 ‘’‘改变变量’‘’ Continue 用于结束当前循环,进入下一次循环,通常与分支结构中的if一起使用  type() 就是一个最实用又简单的查看数据类型的方法 列表的创建 【】‘’‘ lst=【‘hello’,‘world’,98】 list()’‘’ Index 如果列表中存在N个相同元素,只返回相同元素中的第一个元素的索引 如果查找的元素在列表中不存在,则会抛出ValueError 还可以在指定的start和stop之间进行查找 lst 获取列表单个元素 (列表指定元素在列表中是否存在) in 存在 not in 表示不存在 for (迭代变量) in 列表元素的增加操作 Append()在列表的末尾添加一个元素 Extend() 在列表的末尾至少添加一个元素 Insert () 在列表的任意位置添加一个元素 切片 在列表的任意位置添加至少一个元素 列表元素的删除操作 Remove()一次删除一个元素 重复元素只删除第一个 元素不存在抛出ValueError Pop() 删除一个指定索引位置上的元素 指定索引不存在抛出IndexError 不指定索引,删除列表中最后一个元素 切片 一次致少删除一个元素 clear 清空列表 del 删除列表 列表元素的排序操作 sort() 排序 sort(reverse=True) 降序排序 sort (reverse=False) 升序排序 Sorted 对列表进行排序,将产生一个新的列表对象 字典 {} [] KeyError 没有在字典找到 Get None 不算报错 del [] 删除指定的key-value对 Clear 清空字典的元素 scores[‘’] 字典元素的新增 字典的常用操作 Key() 获取字典中所有key Values() 获取字典中所有value Items () 获取字典中所有key.value对 字符串的编码与解码 GBK这种编码格中一个中文占两个字节 UTF-8这种编辑格式中,一个中文占三个字节 byte 解码 byte=s.encode(encoding=‘GBK’) 函数参数定义 * 个数可变的位置形参 ** 关键字形参 变量的作用域 global 全局变量 Bug的常见类型 try except 异常处理 Try except else 如果try块中没有抛出异常,则执行else块,如果try中抛 出异常,则执行except块 try except else finally finally块无论是否发生异常都会被执行,能常用来释放try块中申请的资源

0
2023-04-13 19:15
更新于: 2022-10-26 浏览: 145