爬虫 4 excel&csv的创建和读取
excel的创建和读取
import openpyxl # 写入的代码: wb = openpyxl.Workbook() sheet = wb.active sheet.title = 'new title' sheet['A1'] = '漫威宇宙' rows = [['美国队长','钢铁侠','蜘蛛侠','雷神'],['是','漫威','宇宙', '经典','人物']] for i in rows: sheet.append(i) print(rows) wb.save('Marvel.xlsx') # 读取的代码: wb = openpyxl.load_workbook('Marvel.xlsx') sheet = wb['new title'] sheetname = wb.sheetnames print(sheetname) A1_cell = sheet['A1'] A1_value = A1_cell.value print(A1_value)
CSV的创建和写入
# 引用csv模块。 import csv # 调用open()函数打开csv文件,传入参数:文件名“demo.csv”、写入模式“w”、newline=''、encoding='utf-8'。 csv_file = open('demo.csv','w',newline='',encoding='utf-8') # 用csv.writer()函数创建一个writer对象。 writer = csv.writer(csv_file) # 调用writer对象的writerow()方法,可以在csv文件里写入一行文字 “电影”和“豆瓣评分”。 writer.writerow(['电影','豆瓣评分']) # 在csv文件里写入一行文字 “银河护卫队”和“8.0”。 writer.writerow(['银河护卫队','8.0']) # 在csv文件里写入一行文字 “复仇者联盟”和“8.1”。 writer.writerow(['复仇者联盟','8.1']) # 写入完成后,关闭文件就大功告成啦! csv_file.close()
CSV的读取
import csv csv_file=open('demo.csv','r',newline='',encoding='utf-8') reader=csv.reader(csv_file) for row in reader: print(row) csv_file.close()
CSV模块的更多用法:https://yiyibooks.cn/xx/python_352/library/csv.html#module-csv
结合第3课的内容,把爬来的数据保存到excel的操作方法如下
import requests,openpyxl # 创建工作簿 wb=openpyxl.Workbook() # 获取工作簿的活动表 sheet=wb.active # 工作表重命名 sheet.title='lyrics' sheet['A1'] ='歌曲名' # 加表头,给A1单元格赋值 sheet['B1'] ='所属专辑' # 加表头,给B1单元格赋值 sheet['C1'] ='播放时长' # 加表头,给C1单元格赋值 sheet['D1'] ='播放链接' # 加表头,给D1单元格赋值 url = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp' for x in range(5): params = { 'ct': '24', 'qqmusic_ver': '1298', 'new_json': '1', 'remoteplace': 'txt.yqq.song', 'searchid': '64405487069162918', 't': '0', 'aggr': '1', 'cr': '1', 'catZhida': '1', 'lossless': '0', 'flag_qc': '0', 'p': str(x + 1), 'n': '20', 'w': '周杰伦', 'g_tk': '5381', 'loginUin': '0', 'hostUin': '0', 'format': 'json', 'inCharset': 'utf8', 'outCharset': 'utf-8', 'notice': '0', 'platform': 'yqq.json', 'needNewCode': '0' } res_music = requests.get(url, params=params) json_music = res_music.json() list_music = json_music['data']['song']['list'] for music in list_music: # 以name为键,查找歌曲名,把歌曲名赋值给name name = music['name'] # 查找专辑名,把专辑名赋给album album = music['album']['name'] # 查找播放时长,把时长赋值给time time = music['interval'] # 查找播放链接,把链接赋值给link link = 'https://y.qq.com/n/yqq/song/' + str(music['mid']) + '.html\n\n' # 把name、album、time和link写成列表,用append函数多行写入Excel sheet.append([name,album,time,link]) print('歌曲名:' + name + '\n' + '所属专辑:' + album +'\n' + '播放时长:' + str(time) + '\n' + '播放链接:'+ link) # 最后保存并命名这个Excel文件 wb.save('Jay.xlsx')