本书主页
PHP扩展开发及内核应用
介紹
1. PHP的生命周期
- 1.1. 让我们从SAPI开始
- 1.2. PHP的启动与终止
- 1.3. PHP的生命周期
- 1.4. 线程安全
- 1.5. 小结
2. PHP变量在内核中的实现
- 2.1. 变量的类型
- 2.2. 变量的值
- 2.3. 创建PHP变量
- 2.4. 变量的存储方式
- 2.5. 变量的检索
- 2.6. 类型转换
- 2.7. 小结
3. 内存管理
- 3.1. 内存管理
- 3.2. 引用计数
- 3.3. 总结
4. 配置编译环境
- 4.1. 编译前的准备
- 4.2. PHP编译前的config配置
- 4.3. Unix/Linux平台下的编译
- 4.4. 在Win32平台上编译PHP
- 4.5. 小结
5. 第一个扩展
- 5.1. 一个扩展的基本结构
- 5.2. 编译我们的扩展
- 5.3. 静态编译
- 5.4. 编写函数
- 5.5. 小结
6. 函数的返回值
- 6.1. 一个特殊的参数：return_value
- 6.2. 引用与函数的执行结果
- 6.3. 小结
7. 函数的参数
- 7.1. zend_parse_parameters
- 7.2. Arg Info 与类型绑定
- 7.3. 小结
8. Array与HashTable
- 8.1. 数组(C中的)与链表
- 8.2. 操作HashTable的API
- 8.3. 在内核中操作PHP语言中数组
- 8.4. 小结
9. PHP中的资源类型
- 9.1. 复合类型的数据——资源
- 9.2. Persistent Resources
- 9.3. 资源自有的引用计数
- 9.4. 小结
10. PHP中的面向对象（一）
- 10.1. zend_class_entry
- 10.2. 定义一个类
- 10.3. 定义一个接口
- 10.4. 类的继承与接口的实现
- 10.5. 小结
11. PHP中的面向对象（二）
- 11.1. 生成对象的实例与调用方法
- 11.2. 读写对象的属性
- 11.3. 小结
12. 启动与终止的那点事
- 12.1. 关于生命周期
- 12.2. MINFO与phpinfo
- 12.3. 常量
- 12.4. PHP扩展中的全局变量
- 12.5. PHP语言中的超级全局变量
- 12.6. 小结
13. ini配置文件
- 13.1. 读写ini配置
- 13.2. 小结
14. 流式访问
- 14.1. 流的概览
- 14.2. 打开与读写流
- 14.3. Static Stream Operations
- 14.4. 小结
15. 流的实现
- 15.1. PHP Streams的本质
- 15.2. 流的封装——wrapper
- 15.3. 实现wrapper
- 15.4. Manipulation
- 15.5. 状态与属性读取
- 15.6. 小结
16. 有趣的流
- 16.1. 流的上下文
- 16.2. 流的过滤器
- 16.3. 小结
17. 配置和链接
- 17.1. Autoconf
- 17.2. 库的查找
- 17.3. 强制模块依赖
- 17.4. Speaking the Windows Dialect
- 17.5. 小结
18. 扩展生成器
- 18.1. ext_skel生成器
- 18.2. PECL_Gen生成器
- 18.3. 小结
19. 设置宿主环境
- 19.1. 嵌入式SAPI
- 19.2. 构建并编译一个宿主应用
- 19.3. 通过嵌入包装重新创建cli
- 19.4. 老技术新用
- 19.5. 小结
20. 高级嵌入式
- 20.1. 回调到php中
- 20.2. 错误处理
- 20.3. 初始化php
- 20.4. 覆写INI_SYSTEM和INI_PERDIR选项
- 20.5. 捕获输出
- 20.6. 同时扩展和嵌入
- 20.7. 小结

PHP扩展开发及内核应用

回调到php中

除了加载外部的脚本, 和你在上⼀章看到的类似, 你的php嵌入式应用, 下面将实现⼀个类似于用户空间eval()的命令.

int zend_eval_string(char *str, zval *retval_ptr,
                     char *string_name TSRMLS_DC)

这里, str是实际要执行的php脚本代码, 而string_name是⼀个与执行关联的任意描述信息. 如果发生错误, php会将这个描述信息作为错误输出中的"文件名". retval_ptr, 你应该已经猜到了, 它将被设置为所传递代码产生的返回值. 试试用下面的代码创建新的项目吧.

#include <sapi/embed/php_embed.h>
int main(int argc, char *argv[]) {
    PHP_EMBED_START_BLOCK(argc, argv)
        zend_eval_string("echo 'Hello World!';", NULL, "Simple Hello World App" TSRMLS_CC);
    PHP_EMBED_END_BLOCK()
return 0; 
}

现在使用命令或第19章"设置宿主环境"构建它(将Makefile中或命令中的embed1替换为embed2)

备选方案: 脚本文件的包含

可以预见的是, 这使得编译和执行外部脚本文件远比之前的方法更加容易, 因为你的应用可以将原本复杂的打开/准备/执行的执行序列, 以这种简化但功能更加强大的设计替代:

#include <sapi/embed/php_embed.h>
int main(int argc, char *argv[]) {
    char    *filename;
    if ( argc <= 1 ) {
        fprintf(stderr, "Usage: %s <filename.php> <arguments>\n", argv[1]);
        return -1;
    }
    filename    = argv[1];
/* 忽略第0个参数 */ argc --;
argv ++;
    PHP_EMBED_START_BLOCK(argc, argv)
        char    *include_script;
        spprintf(&include_script, 0, "include '%s';", filename);
        zend_eval_string(include_script, NULL, filename TSRMLS_CC);
        efree(include_script);
    PHP_EMBED_END_BLOCK()
    return 0;
}

注意: 这种特殊的方法必须接受一个缺点, 如果文件名包含单引号, 将导致解析错误. 不过这可以通过使用ext/standard/php_string.h中的php_addslashes()API调用解决. 花一些时间去阅读这个文件以及附录中的API参考, 你会发现很多的特性, 它们可以让你避免在以后重造轮子.

调用用户空间函数

如你看到的加载和执行脚本文件, 在内部有两种方式调用用户空间函数. 现在最明显的可能是重用zend_eval_string(), 将函数名和所有它的参数组织到⼀个庞大的字符串中, 然后收集返回值.

PHP_EMBED_START_BLOCK(argc, argv)
    char    *command;
    zval    retval;
    spprintf(&command, 0, "nl2br('%s');", argv[1]);
    zend_eval_string(command, &retval, "nl2br() execution" TSRMLS_CC);
    efree(command);
    printf("out: %s\n", Z_STRVAL(retval));
    zval_dtor(&retval);
PHP_EMBED_END_BLOCK()

和前面的include很像, 这个方法有⼀个致命的缺陷: 如果输入参数paramin(译者给出的例子中是argv[1])给出⼀个错误的数据, 函数将会失败, 或者更糟糕的是导致无法预期的结果. 解决方案是永远都避免编译代码的运行时片段, 并直接使用call_user_function()API调用函数.

int call_user_function(HashTable *function_table, zval **object_pp,
                       zval *function_name, zval *retval_ptr,
                       zend_uint param_count, zval *params[] TSRMLS_DC);

实际上从引擎外部调用时, function_table总是EG(function_table). 如果调用⼀个对象或类方法, object_pp需要是IS_OBJECT类型的调用实例zval, 或者对于类的静态调用则是 IS_STRING的值. function_name通常是IS_STRING的值, 包含要调用的函数名, 但是它也可以是IS_ARRAY, 第0个元素包含一个对象或类名, 第1个元素包含方法名.

这个函数调用的结果是向传入的retval_ptr指向的zval设置返回值. param_count和 params扮演了argc/argv的角色. 也就是说, params[0]包含所传递的第一个参数, params[param_count - 1]包含了所传递的最后一个参数.

下面是用这种方法重新实现上面的例子:

PHP_EMBED_START_BLOCK(argc, argv)
    char    *command;
    zval    retval;
    spprintf(&command, 0, "nl2br('%s');", argv[1]);
    zend_eval_string(command, &retval, "nl2br() execution" TSRMLS_CC);
    efree(command);
    printf("out: %s\n", Z_STRVAL(retval));
    zval_dtor(&retval);
PHP_EMBED_END_BLOCK()
int call_user_function(HashTable *function_table, zval **object_pp,
                       zval *function_name, zval *retval_ptr,
                       zend_uint param_count, zval *params[] TSRMLS_DC);
PHP_EMBED_START_BLOCK(argc, argv)
    zval    *args[1];
    zval    retval, str, funcname;
    ZVAL_STRING(&funcname, "nl2br", 0);
    args[0] = &str;
    ZVAL_STRINGL(args[0], "HELLO WORLD!", sizeof("HELLO WORLD!"), 1);
    call_user_function(EG(function_table), NULL, &funcname, &retval, 1, args TSRMLS_CC);
    printf("out: %s\n", Z_STRVAL(retval));
    zval_dtor(args[0]);
    zval_dtor(&retval);
PHP_EMBED_END_BLOCK()

尽管代码看起来比较长, 但是工作量会显著降低, 因为这里没有要编译的中间代码, 传递的数据不需要复制, 每个参数都已经在Zend兼容的结构体中. 同时, 要记得原来的例子中在字符串中包含单引号时会有潜在的错误. 而这个版本没有这个问题.

PHP扩展开发及内核应用

回调到php中

备选方案: 脚本文件的包含

调用用户空间函数

links