在整理詞庫的過程中遇到 一個問題,有些其實是同一個關鍵詞之關有空格的話,無法正常被去重,那么有沒有辦法能快快速去除這些字符中間的空格呢?經過百度一番,找到一個解決辦法,記錄一下。
效果如下圖所示,圖上半部分是示例文本,下半部分就是用shell去掉空格后的效果。其中用到就是下面第3個方法。
在UNIX上使用sed命令進行字符串處理中常常遇到的問題就是行首行尾的空格怎么刪除。
下面介紹sed是怎樣實現的,當然awk同樣可以。
1、刪除行首空格
說明:
第一個/的左邊是s表示替換,即將空格替換為空。
第一個/的右邊是表示后面的以xx開頭。
中括號表示“或”,空格或tab中的任意一種。這是正則表達式的規范。
中括號右邊是*,表示一個或多個。
第二個和第三個/中間沒有東西,表示空
g表示替換原來buffer(緩沖區)中的,sed在處理字符串的時候并不對源文件進行直接處理,先創建一個buffer,但是加g表示對原buffer進行替換
整體的意思是:用空字符去替換一個或多個用空格或tab開頭的本體字符串
2、刪除行末空格
但是要注意在KSH中,Tab并不是/t而是直接打入一個Tab就可以了。
3、刪除所有的空格
新聞熱點
疑難解答