其他

PHP调用语音识别API接口实现教程

悠悠楠杉

2025-11-15

0 评论

50 阅读

正在检测是否收录...

11/15

在当今智能化应用日益普及的背景下，语音识别技术已成为人机交互的重要方式之一。对于PHP开发者而言，虽然PHP并非专为人工智能设计的语言，但通过调用成熟的第三方API接口，依然可以轻松实现语音转文字的功能。本文将带你一步步掌握如何使用PHP调用百度AI语音识别接口和Google Cloud Speech-to-Text服务，构建具备语音识别能力的应用。

首先，我们需要明确语音识别API的基本工作原理：客户端上传一段音频文件或实时音频流，服务器端通过深度学习模型将语音内容转换为文本，并返回结构化结果。目前市面上主流的服务商包括百度AI开放平台、Google Cloud、阿里云等，其中百度在国内访问更稳定，Google则支持更多语种和更高准确率。

我们以百度AI语音识别为例，演示具体实现流程。第一步是注册百度AI开放平台账号并创建应用。登录ai.baidu.com后，进入“控制台” -> “语音识别”，创建新应用。创建成功后，系统会生成API Key、Secret Key以及Access Token获取地址。这个Token是调用接口的身份凭证，需通过OAuth 2.0协议动态获取。

接下来，在PHP项目中引入必要的工具类。我们可以使用原生cURL函数发送HTTP请求。以下是一个获取AccessToken的封装函数：

php
function getBaiduToken($apiKey, $secretKey) {
$url = "https://aip.baidubce.com/oauth/2.0/token";
$postdata = [ 'granttype' => 'clientcredentials', 'clientid' => $apiKey,
'client_secret' => $secretKey
];

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($post_data));
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$response = curl_exec($ch);
curl_close($ch);

$result = json_decode($response, true);
return $result['access_token'];

}

获取Token后，即可调用语音识别接口。百度支持多种格式（如PCM、WAV、AMR），采样率通常为8000或16000Hz。假设我们有一个名为audio.wav的录音文件，需先将其读取为二进制数据并进行Base64编码：

php
$audioFile = filegetcontents('audio.wav');
$base64Audio = base64_encode($audioFile);
$fileSize = filesize('audio.wav');

$data = [
'format' => 'wav',
'rate' => 16000,
'channel'=> 1,
'cuid' => 'youruniqueid',
'token' => $token,
'len' => $fileSize,
'speech' => $base64Audio
];

$jsonData = jsonencode($data); $url = 'https://vop.baidu.com/proapi';

$ch = curlinit(); curlsetopt($ch, CURLOPTURL, $url); curlsetopt($ch, CURLOPTPOST, 1); curlsetopt($ch, CURLOPTPOSTFIELDS, $jsonData); curlsetopt($ch, CURLOPTHTTPHEADER, [ 'Content-Type: application/json', 'Content-Length: ' . strlen($jsonData) ]); curlsetopt($ch, CURLOPTRETURNTRANSFER, true); $response = curlexec($ch);
curl_close($ch);

$result = jsondecode($response, true); if (isset($result['result'])) { echo "识别结果：" . $result['result'][0]; } else { echo "识别失败：" . $result['errmsg'];
}

上述代码完成了从音频读取到结果解析的完整流程。需要注意的是，百度免费版有调用频率和时长限制，生产环境建议升级为付费套餐。

若选择Google Speech API，则需先注册Google Cloud账号，启用Speech-to-Text API，并下载JSON格式的密钥文件。通过Google官方提供的PHP客户端库（可使用Composer安装），调用方式更为简洁：

bash composer require google/cloud-speech

php
use Google\Cloud\Speech\V1\SpeechClient;
use Google\Cloud\Speech\V1\RecognitionAudio;
use Google\Cloud\Speech\V1\RecognitionConfig;
use Google\Cloud\Speech\V1\RecognitionConfig\AudioEncoding;

$client = new SpeechClient(['keyFilePath' => 'path/to/your-key.json']);

$config = new RecognitionConfig([
'encoding' => AudioEncoding::LINEAR16,
'sampleratehertz' => 16000,
'language_code' => 'zh-CN'
]);

$audio = new RecognitionAudio(['content' => filegetcontents('audio.wav')]);

$response = $client->recognize($config, $audio);
foreach ($response->getResults() as $result) {
foreach ($result->getAlternatives() as $alternative) {
echo $alternative->getTranscript();
}
}

$client->close();

相比百度的手动签名与Token管理，Google的SDK封装更加友好，适合追求开发效率的团队。

无论使用哪种服务，都应关注音频质量。背景噪音、语速过快或发音不清都会影响识别准确率。建议前端录制时采用降噪处理，并确保采样率与API要求一致。

通过以上步骤，PHP开发者完全可以将强大的语音识别能力集成到Web系统、客服机器人或语音笔记等应用场景中。关键在于理解API机制、合理处理认证流程，并做好异常捕获与日志记录。随着语音技术不断进步，未来PHP也能在智能交互领域发挥更大作用。

语音转文字 PHP语音识别百度语音API Google Speech API PHP调用API

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/38652/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权

PHP调用语音识别API接口实现教程

人生倒计时