维基百科在哪里可以打开?

发布网友

我来回答

2个回答

懂视网

urllib.request import urlopen from bs4 import BeautifulSoup import re import datetime import random import pymysql.cursors # Connect to the database connection = pymysql.connect(host=‘127.0.0.1‘, port=3306, user=‘root‘, password=‘数据库密码‘, db=‘scraping‘, charset=‘utf8mb4‘, cursorclass=pymysql.cursors.DictCursor) cur = connection.cursor() random.seed(datetime.datetime.now()) def store(title,content): cur.execute("INSERT INTO pages(title,content)values("%s","%s")",(title,content)) cur.connection.commit() def getLinks(articleUrl): html = urlopen("http://en.wikipedia.org"+articleUrl) bsObj = BeautifulSoup(html,"html.parser") title = bsObj.find("h1").get_text() print(title) content = bsObj.find("div",{"id":"mw-content-text"}).find("p").get_text() print(content) store(title,content) return bsObj.find("div",{"id":"bodyContent"}).findAll("a",href=re.compile("^(/wiki/)((?!:).)*$")) links = getLinks("/wiki/Kevin_Bacon") try: while len(links) > 0 : newArticle = links[random.randint(0, len(links)-1)].attrs["href"] #print(newArticle) links = getLinks(newArticle) finally: cur.close() connection.close()

结果截图

技术分享

 

注:

  由于维基百科上我们会遇到各种各样的字符,所以最好通过下面四条语句让数据库支持unicode:

  

    alter database scraping character set = utf8mb4 collate = utf8mb4_unicode_ci;

    alter table pages convert to character set = utf8mb4 collate = utf8mb4_unicode_ci;

    alter table pages change title title varchar(200) character set = utf8mb4 collate = utf8mb4_unicode_ci;

    alter table pages change content content varchar(10000) character set = utf8mb4 collate = utf8mb4_unicode_ci;

 

爬取维基百科人物介绍,并使用pymysql存储到数据库

标签:font   value   obj   open   utf8mb4   att   pre   images   attrs   

热心网友

维基百科在百度可以打开,具体步骤如下:

1、打开百度搜索,在百度搜索首页进行搜索;

2、在搜索框输入关键词中文维基百科,点击搜索会显示多个词条;

3、在词条中找到网站中文维基百科,点击进入;

4、进入主页就可以查看维基百科首页的相关内容;

5、在右上角的输入框内输入想要搜索的内容就可以查看百科内容。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com