簡介
有時候需要確定一篇新聞文本的地名,比如
上海市實施了垃圾分類...
其地名,即歸屬地是上海,本工具就是實現這個功能的。
給定一篇文章,可包含標題和正文(或僅標題,僅正文),確定其 歸屬地 (地名)。
-
結果標準:
- 區分國內國外,
- 國外到國家名一級
- 國內到省市一級
安裝
- 使用 python3
$ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .
使用方法
樣例1
import
loc_reg
title
=
'湖南2018年度企業環境信用評價公示 39家企業擬被評“不良”'
passage
=
'今天,記者從湖南省生態環境廳獲悉,我省2018年度企業環境信用評價擬定結果正在長沙市進行公示,擬評定環境誠信企業31家、環境合格企業1247家、環境風險企業121家、環境不良企業39家。'
print
(
loc_reg
.
predict
(
title
,
passage
)
)
結果為:
{
'國內'
:
[
{
'省'
:
'湖南'
,
'市'
:
'長沙'
}
]
}
樣例2
passage
=
'近日,布魯塞爾爆發了大規模罷工游行,城市服務、商店、餐飲店均受到影響,原因和歐盟稅收等政策有關。'
print
(
loc_reg
.
predict
(
passage
)
)
結果為:
{
'國外'
:
[
'比利時'
]
}
說明
- 從輿情新聞數據中隨機抽取 100 篇自測,正確率 93%。其他類型文本未測試,效果待定。
如果覺得好用,請 follow 我一下 https://github.com/dongrixinyu
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
