學習python少不了寫爬蟲,不僅能以點帶面地學習、練習使用python,爬蟲本身也是有用且有趣的,大量重復性的下載、統計工作完全可以寫一個爬蟲程序完成。用python寫爬蟲需要python的基礎知識、涉及網絡的幾個模塊、正則表達式、文件操作等知識。昨天在網上學習了一下,寫了一個爬蟲自動下載「糗事百科」里面的圖片。源代碼如下:復制代碼代碼如下:#-*-coding:utf-8-*-#上面那句讓代碼里支持中文#------------------------
系統 2019-09-27 17:45:42 1790
不論什么語言,我們都需要注意性能優化問題,提高執行效率。選擇了腳本語言就要忍受其速度,這句話在某種程度上說明了Python作為腳本語言的不足之處,那就是執行效率和性能不夠亮。盡管Python從未如C和Java一般快速,但是不少Python項目都處于開發語言領先位置。Python很簡單易用,但大多數人使用Python都知道在處理密集型cpu工作時,它的數量級依然低于C、Java和JavaScript。但不少第三方不愿贅述Python的優點,而是決定自內而外提
系統 2019-09-27 17:45:40 1790
任何高級語言都是需要一個自己的編程環境的,這就好比寫字一樣,需要有紙和筆,在計算機上寫東西,也需要有文字處理軟件,比如各種名稱的OFFICE。筆和紙以及office軟件,就是寫東西的硬件或軟件,總之,那些文字只能寫在那個上邊,才能最后成為一篇文章。那么編程也是,要有個什么程序之類的東西,要把程序寫到那個上面,才能形成最后類似文章那樣的東西。剛才又有了一個術語――“程序”,什么是程序?本文就不講了。如果列為觀眾不是很理解這個詞語,請上網google一下。注:
系統 2019-09-27 17:45:26 1790
1.能調用方法的一定是對象,比如數值、字符串、列表、元組、字典,甚至文件也是對象,Python中一切皆為對象。str1='hello'str2='world'str3=''.join([str1,str2])print(str3)2.三種基本的文件操作模式:r(only-read)、w(only-write)、a(append)對文件進行操作的流程:第一,建立文件對象。第二,調用文件方法進行操作。第三,不要忘了關閉文件。(文件不關閉的情況下,內容會放在緩存
系統 2019-09-27 17:38:34 1790
1、安裝virtulenv、virtulenvwrapper包pipinstallvirtualenvvirtualenvwrapper2、virtualenvwrapper是virtualenv的擴展工具,可以方便的創建、刪除、復制、切換不同的虛擬環境。3、設置環境變量,把下面兩行添加到~/.bash_profile里exportWORKON_HOME=/software/venvsource/usr/local/bin/virtualenvwrappe
系統 2019-09-27 17:38:34 1790
閉包并不是什么新奇的概念,它早在高級語言開始發展的年代就產生了。閉包(Closure)是詞法閉包(LexicalClosure)的簡稱。對閉包的具體定義有很多種說法,這些說法大體可以分為兩類:一種說法認為閉包是符合一定條件的函數,比如參考資源中這樣定義閉包:閉包是在其詞法上下文中引用了自由變量的函數。另一種說法認為閉包是由函數和與其相關的引用環境組合而成的實體。比如參考資源中就有這樣的的定義:在實現深約束時,需要創建一個能顯式表示引用環境的東西,并將它與相
系統 2019-09-27 17:38:28 1790
前言每個人寫腳本時的格式都會有所不同,有的會注明腳本本身的一些信息,有的則開門見山,這在小團隊里其實沒什么,基本別人做什么你也都知道,但如果放到大的團隊就比較麻煩了,因為隨著人數的增多,腳本成指數增長,如果每個人風格不統一,到最后就會造成非常大的弊端,所以當團隊人數增長后,就必須有一套標準,形成大家統一的編碼規則,這樣即使不看腳本具體實現,也知道這個腳本的功能是什么。我們今天分享的一段腳本是自動添加注釋信息的腳本,添加的信息包括腳本名稱、作者、時間、描述、
系統 2019-09-27 17:38:27 1790
測了一下django、flask、bottle、tornado框架本身最簡單的性能。對django的性能完全無語了。django、flask、bottle均使用gunicorn+gevent啟動,單進程,并且關閉DEBUG,請求均只返回一個字符串ok。tornado直接自己啟動,其他內容一致。測試軟件為siege,測試os為cenos664位,測試命令為:復制代碼代碼如下:siege-c100-r100-bhttp://127.0.0.1:5000/dja
系統 2019-09-27 17:38:25 1790
最近開始學著用Python+Tornado+MongoDB寫網站,興起寫了一個博客,覺得很有意思所以想掛在服務器上發布出去找大家一起玩。這個時候就遇到了問題。服務器是windows系統,安裝的是Apache,所以需要配置Apache,使Apache同時支持PHP和Python。廢話少說,提供有效方案一個,照做即可:1.修改httpd.conf文件將下列幾個Module前的注釋符#去掉LoadModuleproxy_modulemodules/mod_pro
系統 2019-09-27 17:38:20 1790
Python程序能用很多方式處理日期和時間。轉換日期格式是一個常見的例行瑣事。Python有一個time和calendar模組可以幫忙。什么是Tick?時間間隔是以秒為單位的浮點小數。每個時間戳都以自從1970年1月1日午夜(歷元)經過了多長時間來表示。Python附帶的受歡迎的time模塊下有很多函數可以轉換常見日期格式。如函數time.time()用ticks計時單位返回從12:00am,January1,1970(epoch)開始的記錄的當前操作系統
系統 2019-09-27 17:38:10 1790