종종 쓰게되는 Html 에서 Text 만 추출하는 함수 입니다. 예전에 외국 블로그에서 받아둔 소스 같은데 출처는 적어두질 못했네요. ㅎ
(오랫동안 잊고 지내다가 회사 팀장님이 이런 소스 본적 있냐고 물어보셔서 급! 생각이 나 올려둡니다.)
설명하자면 변수(Html)를 Parameter로 받아서 정규식으로 태그를 삭제한 후 Text 만을 Return 하는 소스입니다.
//HTML 에서 Text만 추출한다. public static string StripHtml(string Html) { string output; //get rid of HTML tags output = System.Text.RegularExpressions.Regex.Replace(Html, "<[^>]*>", string.Empty); //get rid of multiple blank lines output = System.Text.RegularExpressions.Regex.Replace(output, @"^\s*$\n", string.Empty, System.Text.RegularExpressions.RegexOptions.Multiline); return output; }
'The Piece of Code' 카테고리의 다른 글
[C#] Image Resize - Winfrom (0) | 2016.02.10 |
---|---|
[CSS] margin, pdding 순서 (0) | 2015.02.03 |
[javascript] 모바일 기기 구분하기 (0) | 2013.02.28 |
[Windows 8, C#] MessageDialog (0) | 2013.01.20 |
[C#] Base64 Encoding, Decoding (0) | 2012.12.07 |