最近想學習一些python數據分析的內容,就弄了個爬蟲爬取了一些數據,并打算用Anaconda一套的工具(pandas, numpy, scipy, matplotlib, jupyter)等進行一些初步的數據挖掘和分析。
在使用matplotlib畫圖時,橫坐標為中文,但是畫出的條形圖橫坐標總是顯示“框框”,就去查資料解決。感覺這應該是個比較常見的問題,網上的中文資料也確實很多,但是沒有任何一個徹底解決了我遇到的問題。零零碎碎用了快3個小時的時間,才終于搞定。特此分享,希望能幫到有同樣問題的童鞋。
運行環境:
python2.7
Linux Centos7
用conda安裝的matplotlib和pandas
問題:
matplotlib畫圖,無法顯示中文
問題原因:
linux操作系統以及matplotlib的字體庫中,沒有可用的中文字體
matplotlib包默認只支持ASCII碼,不支持unicode碼
網上資料總結:
修改matplotlib的資源配置文件,例如增加"Simhei"字體(這個字體并不是所有的linux系統都有的好嘛!修改了并沒有作用)
給linux安裝中文字體,并修改matplotlib的資源配置文件。(呵呵,并沒有作用)
解決方案:
其實也是綜合了網上的各種解決方案。總體說來有以下幾個步驟:
1. 獲取matplotlibrc文件所在路徑。在jupyter notebook中獲?。?
import matplotlib matplotlib.matplotlib_fname()
例如,我的這個文件在:
u'~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/matplotlibrc'
后續步驟會修改此文件中的font參數。
2. 看看系統中的所有字體,以及可用的中文字體。也是在jupyter nb中:
from matplotlib.font_manager import FontManager import subprocess fm = FontManager() mat_fonts = set(f.name for f in fm.ttflist) print mat_fonts output = subprocess.check_output( 'fc-list :lang=zh -f "%{family}\n"', shell=True) print '*' * 10, '系統可用的中文字體', '*' * 10 print output zh_fonts = set(f.split(',', 1)[0] for f in output.split('\n')) available = mat_fonts & zh_fonts print '*' * 10, '可用的字體', '*' * 10 for f in available: print f
做完上述操作,會發現“可用的字體”這里為空。因為沒有中文字體給matplotlib用(所以才會中文都顯示“框框”)
3. 假設操作系統中沒有中文字體。 此時下載一個ttf中文字體,并在cenos中安裝。要安裝那種系統能檢測font-family的,否則無效。
解壓rar文件。在 /usr/share/fonts 路徑下創建存放此字體的文件夾yourfontdir,并下載的ttf文件復制到yourfontdir中(可以給文件改個英文名,方便操作)
4. 給cenos安裝這個字體。
cd /usr/share/fonts/yourfontsdir #生成字體索引信息. 會顯示字體的font-family sudo mkfontscale sudo mkfontdir #更新字體緩存: fc-cache
5. 修改matplotlibrc文件
修改步驟1中獲取的matplotlibrc文件配置。
將font.family 部分注釋去掉,并且在font.serif 支持字體加上一個中文字體。這里就加上剛才下載的中文字體的font-family. 可以通過 fc-list 命令查找一下(所以前面最好記下來)。我這里增加的是"WenQuanYi Zen Hei Mono"字體。
下面這句注釋要去掉,不然中文減號也顯示方塊:
axes.unicode_minus : False
6. 這一步驟最重要!為matplotlib增加中文字體
完成步驟5后,再操作步驟2,會發現“可用的中文字體”已經有了剛才安裝的字體,但是畫圖仍然不能顯示中文。這是因為你這個字體給centos安裝了、也告訴matplotlib要用這個字體了,但是,matplotlib找不到這個字體的ttf文件啊。。。。所以需要給它弄一個。
將下載的ttf字體復制一份到以下路徑:
~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/fonts/ttf
并刪除相關cache。在以下路徑:
~/.cache/matplotlib
刪除其中與字體有關的cache
7. 現在重新畫個圖試試。搞定。
以上這篇基于Linux系統中python matplotlib畫圖的中文顯示問題的解決方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
