字符串函数

PHP htmlspecialchars() 函数

主题:PHP 字符串参考上一页|下一页

说明

htmlspecialchars() 函数将在 HTML 上下文中具有特殊含义的字符转换为其等效的 HTML 实体。 以下字符被视为特殊字符:

  • & (ampersand) converted to &
  • " (double quote) converted to ", unless ENT_NOQUOTES is set.
  • ' (single quote) converted to ' (for ENT_HTML401, this is default) or ' (for ENT_XML1, ENT_XHTML or ENT_HTML5), but only when ENT_QUOTES is set.
  • < (less than) converted to &lt;
  • > (greater than) converted to &gt;

此函数通常会反转 htmlspecialchars_decode() 函数的效果。

下表总结了该函数的技术细节。

返回值: 返回转换后的字符串。 如果输入字符串在给定的 charset 中包含无效的代码序列,它将返回一个空字符串,除非 ENT_IGNOREENT_SUBSTITUTE< /code> 标志已设置。
版本: PHP 4+

语法

htmlspecialchars() 函数的基本语法如下:

htmlspecialchars(string, flags, charset, double_encode);

下面的例子展示了 htmlspecialchars() 函数的作用。

<?php
// 示例字符串
$str = "It's an <b>amazing</b> story.";

// 转换字符串
echo htmlspecialchars($str);
?>

上述示例的输出将是(查看源代码以获取想法):

It's an &lt;b&gt;amazing&lt;/b&gt; story.

但是,在浏览器中,您会看到如下内容:

It's an <b>amazing</b> story.

注意: htmlspecialchars() 在所有方面都与 htmlentities() 相同,只是 htmlspecialchars() 仅替换 &, <, 和 >,具有单引号和双引号选项。 但是 htmlentities() 替换了所有可以用 HTML 字符实体表示的字符。

提示:您可以使用 get_html_translation_table() 函数返回在内部用于 htmlspecialchars()htmlentities() 函数的转换表。


参数

htmlspecialchars() 函数接受以下参数。

参数 说明
string 必填。 指定要转换的字符串。
flags

可选。 指定如何处理引号、无效代码序列以及要使用的文档类型。 您可以指定以下一个或多个标志。

处理引号的可用标志常量是:

  • ENT_COMPAT – 转换双引号,不转换单引号。
  • ENT_QUOTES – 转换双引号和单引号。
  • ENT_NOQUOTES – 不转换双引号和单引号。

用于处理无效代码序列的可用标志常量是:

  • ENT_IGNORE – 静默忽略无效的代码序列,而不是返回空字符串。 避免使用此标志,因为它可能具有安全隐患。
  • ENT_SUBSTITUTE – 用 Unicode 替换字符 U+FFFD (UTF-8) 或 &#FFFD; 替换无效的代码序列 而不是返回一个空字符串。
  • ENT_DISALLOWED – 将对指定文档类型无效的代码序列替换为 Unicode 替换字符 U+FFFD (UTF-8) 或 &#FFFD; 而不是让它们保持原样。

用于指定文档类型的可用标志常量有:

  • ENT_HTML401 – 将代码处理为 HTML 4.01。
  • ENT_HTML5 – 将代码处理为 HTML 5。
  • ENT_XML1 – 将代码处理为 XML 1。
  • ENT_XHTML – 将代码处理为 XHTML。

此参数的默认值为 ENT_COMPAT | ENT_HTML401.

charset

可选。 指定要使用的字符集。 支持的字符集是:

  • UTF-8 – ASCII 兼容多字节 8 位 Unicode。
  • ISO-8859-1 –西欧,拉丁语 1。
  • ISO-8859-5 –很少使用西里尔字符集(拉丁文/西里尔文)。
  • ISO-8859-15 西欧,拉丁语 9。添加了 Latin-1 (ISO-8859-1) 中缺少的欧元符号、法语和芬兰语字母。
  • cp866 – DOS 特定的西里尔字符集。
  • cp1251 –特定于 Windows 的西里尔字符集。
  • cp1252 –西欧的 Windows 特定字符集。
  • KOI8-R –俄语。
  • BIG5 –繁体中文,主要用于台湾。
  • GB2312 –简体中文,国标字符集。
  • BIG5-HKSCS – Big5 带有香港扩展名,繁体中文。
  • Shift_JIS –日语。
  • EUC-JP –日语。
  • MacRoman – Mac OS 使用的字符集。

如果省略此参数,则默认为 default_charset 配置选项的值(在 php.ini 文件中)。

double_encode 可选。 一个布尔值,它指定是否对现有的 html 实体进行编码。 可能的值为 truefalse。 默认值是 true 转换一切。

更多示例

这里有更多示例展示了 htmlspecialchars() 函数的实际工作原理:

以下示例演示了使用此函数处理单引号。

<?php
// 示例字符串
$str = "Let's <b>pack</b> \"bag & baggage\".";

// 只转换 <, > & 和双引号
$a = htmlspecialchars($str);
echo $a; // Let's &lt;b&gt;pack&lt;/b&gt; &quot;bag &amp; baggage&quot;.

// 转换所有特殊字符
$b = htmlspecialchars($str, ENT_QUOTES);
echo $b; // Let&#039;s &lt;b&gt;pack&lt;/b&gt; &quot;bag &amp; baggage&quot;.

// 将单引号转换为命名实体
$c = htmlspecialchars($str, ENT_QUOTES | ENT_HTML5);
echo $c; // Let&apos;s &lt;b&gt;pack&lt;/b&gt; &quot;bag &amp; baggage&quot;.
?>

但是,在浏览器中,您将始终看到示例输出的字符串 Let's <b>pack</b> "bag & baggage". 查看源代码(右键单击并选择查看页面源代码)以查看转换后的字符串。

Advertisements