網(wǎng)友wys提問:如何僅使用JavaScript支持的正則語法,將
復(fù)制代碼代碼如下:
<p>
<table> <p> <p> </table>
<table> <p> <p> </table>
<p>
中<table>...</table>之間的<p>都替換為<br/>?
思考
該問題的難點(diǎn)之一在于JavaScript支持的正則特性實(shí)在有限。樓主已經(jīng)想到了非JavaScript的解法,如下:
復(fù)制代碼代碼如下:
re=/(?<=<table.*?)(<p>)(?=.*?<//table>)/gi;
alert (sourcestr.replace(re,"<br>"));
嗯,思路大致是這樣。較真起來,即使JavaScript支持逆序環(huán)視,上面答案并不能夠如愿運(yùn)行。原因是帶有量詞的逆序環(huán)視(即在(?<=)里面使用?, *, +, {}這樣的量詞)是更高級的的語法,極少有語言能夠支持(特例是.Net)。
但是,像樓主這樣的正則問題應(yīng)該是很普便的一個(gè)問題,我們經(jīng)常需要循環(huán)地替換一些內(nèi)容。該如何解答呢?
思路一 閱讀JavaScript的文檔,我找到了lastIndex這樣的東東。根據(jù)這個(gè)東東,我形成了這樣的思路:
•先按外層循環(huán),找到第一組較大的匹配。正則代碼是<table[^>]*>[/s/S]*?<//table>
•定位到這次匹配結(jié)束的起始位置,替換掉這一段字串中所有的<p>。
•循環(huán)執(zhí)行。
我覺得上述思路大致清晰,但是細(xì)節(jié)太多(每次匹配涉及3個(gè)位置點(diǎn),一個(gè)長度),解起來并非從容不迫,最終的代碼想必也不會賞心悅目;尤為重要的是,整個(gè)思路像是原始的 Crack,而不是高手的 Hack 。而且思路與正則關(guān)系不大。我決定換一條路。
思路二 關(guān)鍵是循環(huán)和嵌套。還好不是盜夢空間的深層遞歸。能否將匹配的內(nèi)容保護(hù)起來,替換完之后再放回原位呢?
想到這里,就豁然開朗了。
思路:先找到所有的匹配內(nèi)容,記路在數(shù)組inner中;
同時(shí)使用該正則,將原字串split為另一個(gè)數(shù)組wrapper;
一個(gè)重要的特點(diǎn)是,wrapper一定比inner多一個(gè)元素,它一一將inner項(xiàng)隔開,并處于最外層。wrapper 和 inner 的關(guān)系,就像是一個(gè)手掌的5根指頭與4個(gè)指縫的關(guān)系。將中間的元素取出,記下位置,等處理完之后,再將所有的元素粘合在一起。就是這樣簡單。代碼如下(為了讓問題更有普使性,我稍改了一下源字串):
復(fù)制代碼代碼如下:
<script type="text/javascript">
var str="<p> <table> <p> ,<p> </table> <p> <table> <p> <p> </table> <p> <table> <p> <p> </table>";
var patt=/<table[^>]*>[/s/S]*?<//table>/i;
var wrapper_result=str.split(patt);
var inner_result = str.match(/<table[^>]*>[/s/S]*?<//table>/ig);
var len=inner_result.length;
var final=wrapper_result[0];
for (i=0; i<len; i++)
{
tmp=inner_result[i].replace(/<p>/gi,"<br>");
final+=tmp+wrapper_result[i+1];
}
alert(final);
</script>
貼圖:
更新
果然是能人輩出,評論更精彩!請看評論中的這則代碼:
復(fù)制代碼代碼如下:
alert(sourcestr.replace(/<table.*?//table>/ig, function($1){return $1.replace(/<p>/ig,"<br>")}));
PS: 本站剛剛添加了評論中代碼的解析,可以貼代碼了。格式見評論部分的圖例顯示。謝謝合作!