The Piece of Code

[C#] StripHtml

fonch 2013. 1. 20. 23:32

종종 쓰게되는 Html 에서 Text 만 추출하는 함수 입니다. 예전에 외국 블로그에서 받아둔 소스 같은데 출처는 적어두질 못했네요.

(오랫동안 잊고 지내다가 회사 팀장님이 이런 소스 본적 있냐고 물어보셔서 급! 생각이 나 올려둡니다.)

설명하자면 변수(Html)를 Parameter로 받아서 정규식으로 태그를 삭제한 후 Text 만을 Return 하는 소스입니다.

 

//HTML 에서 Text만 추출한다.
public static string StripHtml(string Html)
{
        string output;
        //get rid of HTML tags
        output = System.Text.RegularExpressions.Regex.Replace(Html, "<[^>]*>", string.Empty);
        //get rid of multiple blank lines
        output = System.Text.RegularExpressions.Regex.Replace(output, @"^\s*$\n", string.Empty, System.Text.RegularExpressions.RegexOptions.Multiline);
        return output;
}


'The Piece of Code' 카테고리의 다른 글

[C#] Image Resize - Winfrom  (0) 2016.02.10
[CSS] margin, pdding 순서  (0) 2015.02.03
[javascript] 모바일 기기 구분하기  (0) 2013.02.28
[Windows 8, C#] MessageDialog  (0) 2013.01.20
[C#] Base64 Encoding, Decoding  (0) 2012.12.07