2022年2月28日 星期一

在 Python 比對中文字串

 在 Python 比對字串

前言

  以前一直有不要在 Python 處理中文的印象,但最近發現 Python3 以後對中文字串已改善,並順便做個學習,在此做個紀錄。


內容

  最近都在用正則表達式,發現就算用中文有沒太大的問題,但那是 JavaScript ,在 Python 也是如此嗎?就結果來說是的,由於我入門 Python 時是在  2 的時期,那時的中文處理很麻煩加上當時我用不到,所以留下了盡量不要用 Python 來處理中文字串的印象,但最近一查發現 Python3 以後對於中文字串處理就變得相當友善,實際範例如下

str = '一'
if str == '一':
    print('equal')
if str in '一二':
    print('contained')
print(str.find('一二')!=-1)#False


要比對字串是否相等時使用"=="就可以,第二個應用是使用"in"來確定字串是否在某個字串裡,這個用法非常直覺,第三個應用是使用"find()",但要注意"find()"的結果是回傳字串的索引值,如果找不到匯回傳"-1"。


參考資料

[ blog.csdn.net ] python 中文字符串比较

2022年2月21日 星期一

用正則表達式檢查中文

 用正則表達式檢查中文

前言

  最近想了一下正則表達式的一些應用,發現似乎沒用過它來檢查中文過,所以就抽空來研究一下,在此做個紀錄。


內容

  這次會使用到 [ coding.tools ] 正則表達式在線測試工具 來做為驗證,如何使用可以參考 線上使用正規表達式。實驗了一下發現遽然可以直接輸入,如下圖

用正則表達式檢查中文

本以為這是線上工具的貼心設計,所以我實際打了個程式碼來驗證,如下

const reg = /一二/g;
let s = '一二..';
console.log( reg.test(s) );//true


結果正確,真的可以直接輸入!如果要檢查所有的中文字可以用 [/u4e00-/u9faf] 來檢查一個中文字。


  不知是不是我對 JavaScript 的偏見,總是認為在 JavaScript 使用中文位很麻煩,必須不斷把字串轉成字碼再搭配"\u"來表達,但現在的 JavaScript 遽然可以直接就檢查中文,真是讓我改觀了。


參考資料

[ coding.tools ] 正則表達式在線測試工具

[ www.itread01.com ] 匹配中文字符的正則表達式: [/u4e00-/u9fa5]


相關文章與資料

線上使用正規表達式

2022年2月14日 星期一

線上使用正規表達式

 線上使用正規表達式

前言

  每次使用正規表達式都要打程式碼會不會覺得很麻煩呢?這次介紹可以在線上使用正規表達式,而且可以馬上得到結果,不須像打程式碼還要按"Run"得到結果,在此做個紀錄。


內容

  使用的線上工具式是 [ coding.tools ] 正則表達式在線測試工具 ,使用的畫面如下

正規表達是在線測試工具的使用畫面


在畫面"1"處輸入正規表達式,在畫面"2"處就是要檢查的內容,工具會把符合的結果反白,這是即時的不須按下任何的按鍵,用起來相當直覺簡單。


  接著提供一些常用的技巧,如果要檢查不是多行,只是單行字串符合某種格式的的話,可以參考以下

^ *ABC *$


上述的例子會檢查去頭尾空白並且中間有"ABC",利用"^"與"$"來放頭尾即可,如果要檢查多行的結果這就不適合,之前的 用正規表達式檢查IP 就有使用這個方法。善用"[]"來限制符合條件的字元,如果要檢查字母後有數字的結果可以使用以下

[A-Za-z]+\d+


範例限定大小字母才能符合資格,接著要搭配"+","+"指的是前面的結果至少出現 1 次,如果有需要還可以搭配"*"與"?","*"是指前面的結果出現 0 次或多次,"?"是指前面的結果出現 0 次或 1 次。如果要檢查帶有小數的數字可以用以下

\d+(.\d+)?


這次要使用"()"來包覆結果,並搭配檢查次數的"?"(檢查前面的結果出現 0 次或 1 次)。如果要檢查"()"包覆的內容可以用以下

\(.*\)


利用"\"後加特殊字元來表明"()",範例中的"."指的是任意字元,所以".*"就可以解釋成任意字元出現 0 次或多次。


參考資料

[ coding.tools ] 正則表達式在線測試工具


相關資料與文章

用正規表達式檢查IP

2022年2月7日 星期一

用 Python 的正規表達式檢查IP

 用 Python 的正規表達式檢查IP

前言

  在先前的 用正規表達式檢查IP 裡使用正規表達式來檢查 IP ,這次用 Python 來完成,在此做個紀錄。


內容

  範例如下

import re
str = '128.0.0.1'
regEx = re.compile( '^((\d|[1-9]\d|1\d\d|2([0-4]\d|5[0-5]))\.){3}(\d|[1-9]\d|1\d\d|2([0-4]\d|5[0-5]))$' )
#check is match?
res = regEx.search( str )
if res is not None:
    print('Match')
else:
    print('Not match')


這次的正規表達式可以參照 用正規表達式檢查IP 裡的作法,但這次字串的字尾不須加".",所以正規表達式看起來相當冗長,單純的將上一次的正規表達式的檢查次數由 4 次改成三次,並在"."後新增檢查 255 的正規表達式即可,這裡用起來跟 JavaScript 的感覺是一樣的。


相關文章與資料

用正規表達式檢查IP