harmony 鸿蒙音频编码
音频编码
开发者可以调用本模块的Native API接口,完成音频编码,即将音频PCM编码压缩成不同的格式。
接口不限制PCM数据的来源,开发者可以调用麦克风录制获取、也可以导入编辑后的PCM数据,通过音频编码,输出对应格式的码流,最后封装为目标格式文件。
当前支持的编码能力请参考AVCodec支持的格式。
适用场景
- 音频录制
通过录制传入PCM,然后编码出对应格式的码流,最后封装成想要的格式。 - 音频编辑
编辑PCM后导出音频文件的场景,需要编码成对应音频格式后再封装成文件。 > 说明: > > AAC编码器默认采用的VBR可变码率模式,与配置的预期参数可能存在偏差。
开发指导
详细的API说明请参考API文档。
参考以下示例代码,完成音频编码的全流程,包括:创建编码器、设置编码参数(采样率/码率/声道数等)、开始、刷新、重置、销毁资源。
在应用开发过程中,开发者应按一定顺序调用方法,执行对应操作,否则系统可能会抛出异常或生成其他未定义的行为。具体顺序可参考下列开发步骤及对应说明。
如下为音频编码调用关系图:
虚线表示可选。
实线表示必选。
在 CMake 脚本中链接动态库
target_link_libraries(sample PUBLIC libnative_media_codecbase.so)
target_link_libraries(sample PUBLIC libnative_media_core.so)
target_link_libraries(sample PUBLIC libnative_media_acodec.so)
开发步骤
添加头文件。
#include <multimedia/player_framework/native_avcodec_audiocodec.h> #include <multimedia/native_audio_channel_layout.h> #include <multimedia/player_framework/native_avcapability.h> #include <multimedia/player_framework/native_avcodec_base.h> #include <multimedia/player_framework/native_avformat.h> #include <multimedia/player_framework/native_avbuffer.h>
创建编码器实例对象,OH_AVCodec *为编码器实例指针。
应用可以通过名称或媒体类型创建编码器。
```cpp
// c++标准库命名空间。
using namespace std;
// 通过 codecname 创建编码器。
OH_AVCapability *capability = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_AUDIO_AAC, true);
const char *name = OH_AVCapability_GetName(capability);
OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByName(name);
```
```cpp
// 设置判定是否为编码;设置true表示当前是编码。
bool isEncoder = true;
// 通过媒体类型创建编码器。
OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByMime(OH_AVCODEC_MIMETYPE_AUDIO_AAC, isEncoder);
```
```cpp
// 初始化队列。
class AEncBufferSignal {
public:
std::mutex inMutex_;
std::mutex outMutex_;
std::mutex startMutex_;
std::condition_variable inCond_;
std::condition_variable outCond_;
std::condition_variable startCond_;
std::queue<uint32_t> inQueue_;
std::queue<uint32_t> outQueue_;
std::queue<OH_AVBuffer *> inBufferQueue_;
std::queue<OH_AVBuffer *> outBufferQueue_;
};
AEncBufferSignal *signal_;
```
- 调用OH_AudioCodec_RegisterCallback()注册回调函数。
注册回调函数指针集合OH_AVCodecCallback,包括:
- OH_AVCodecOnError:编码器运行错误。
- OH_AVCodecOnStreamChanged:音频编码器暂未支持此回调。
- OH_AVCodecOnNeedInputBuffer:运行过程中需要新的输入数据,即编码器已准备好,可以输入PCM数据。
- OH_AVCodecOnNewOutputBuffer:运行过程中产生了新的输出数据,即编码完成。
开发者可以通过处理该回调报告的信息,确保编码器正常运转。
注意: 回调中不建议进行耗时操作。
```cpp
// OH_AVCodecOnError回调函数的实现。
static void OnError(OH_AVCodec *codec, int32_t errorCode, void *userData)
{
(void)codec;
(void)errorCode;
(void)userData;
}
// OH_AVCodecOnStreamChanged回调函数的实现。
static void OnOutputFormatChanged(OH_AVCodec *codec, OH_AVFormat *format, void *userData)
{
(void)codec;
(void)format;
(void)userData;
}
// OH_AVCodecOnNeedInputBuffer回调函数的实现。
static void OnInputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
{
(void)codec;
// 编码输入码流送入InputBuffer队列。
AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);
unique_lock<mutex> lock(signal->inMutex_);
signal->inQueue_.push(index);
signal->inBufferQueue_.push(data);
signal->inCond_.notify_all();
}
// OH_AVCodecOnNewOutputBuffer回调函数的实现。
static void OnOutputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
{
(void)codec;
// 将对应输出buffer的index送入OutputQueue_队列。
// 将对应编码完成的数据data送入outBuffer队列。
AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);
unique_lock<mutex> lock(signal->outMutex_);
signal->outQueue_.push(index);
signal->outBufferQueue_.push(data);
}
signal_ = new AEncBufferSignal();
OH_AVCodecCallback cb_ = {&OnError, &OnOutputFormatChanged, &OnInputBufferAvailable, &OnOutputBufferAvailable};
// 配置异步回调。
int32_t ret = OH_AudioCodec_RegisterCallback(audioEnc_, cb_, signal_);
if (ret != AV_ERR_OK) {
// 异常处理。
}
```
- 调用OH_AudioCodec_Configure设置编码器。
设置必选项:采样率,码率,以及声道数,声道类型、位深。
可选项:最大输入长度。
flac编码: 需要额外标识兼容性级别(Compliance Level)和采样精度。
各音频编码类型参数范围说明: |音频编码类型|采样率(Hz) | 声道数 | |———–|——————————————————————————-|:—————-:| |AAC |8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000|1、2、3、4、5、6、8| |Flac |8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000| 1~8 | |MP3 |8000、11025、12000、16000、22050、24000、32000、44100、48000 | 1~2 | |G711mu |8000 | 1 |
例如对一个44100Hz采样率、2声道立体声、SAMPLE_S16LE采样格式的PCM音频,以32000bps的码率进行AAC编码的调用流程如下:
cpp
int32_t ret;
// 配置音频采样率(必须)。
constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
// 配置音频码率(必须)。
constexpr uint64_t DEFAULT_BITRATE = 32000;
// 配置音频声道数(必须)。
constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
// 配置音频声道类型(必须)。
constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
// 配置音频位深(必须)。
constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE;
// 每20ms一帧音频数据。
constexpr float TIME_PER_FRAME = 0.02;
// 配置最大输入长度, 每帧音频数据的大小(可选)。
constexpr uint32_t DEFAULT_MAX_INPUT_SIZE = DEFAULT_SAMPLERATE * TIME_PER_FRAME * DEFAULT_CHANNEL_COUNT * sizeof(short); // aac
OH_AVFormat *format = OH_AVFormat_Create();
// 写入format。
OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
OH_AVFormat_SetLongValue(format,OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
OH_AVFormat_SetLongValue(format,OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
OH_AVFormat_SetIntValue(format,OH_MD_KEY_MAX_INPUT_SIZE, DEFAULT_MAX_INPUT_SIZE);
// 配置编码器。
ret = OH_AudioCodec_Configure(audioEnc_, format);
if (ret != AV_ERR_OK) {
// 异常处理。
}
例FLAC调用流程:
```cpp
int32_t ret;
// 配置音频采样率(必须)。
constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
// 配置音频码率(必须)。
constexpr uint64_t DEFAULT_BITRATE = 261000;
// 配置音频声道数(必须)。
constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
// 配置音频声道类型(必须)。
constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
// 配置音频位深(必须) flac只有SAMPLE_S16LE和SAMPLE_S32LE。
constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S32LE;
// 配置音频compliance level (默认值0,取值范围-2~2)。
constexpr int32_t COMPLIANCE_LEVEL = 0;
// 配置音频精度(必须) SAMPLE_S16LE和SAMPLE_S24LE和SAMPLE_S32LE。
constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S24LE;
OH_AVFormat *format = OH_AVFormat_Create();
// 写入format。
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_BITS_PER_CODED_SAMPLE, BITS_PER_CODED_SAMPLE);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_COMPLIANCE_LEVEL, COMPLIANCE_LEVEL);
// 配置编码器。
ret = OH_AudioCodec_Configure(audioEnc_, format);
if (ret != AV_ERR_OK) {
// 异常处理。
}
```
<!--RP2--><!--RP2End-->
调用OH_AudioCodec_Prepare(),编码器就绪。
ret = OH_AudioCodec_Prepare(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 }
调用OH_AudioCodec_Start()启动编码器,进入运行态。
unique_ptr<ifstream> inputFile_ = make_unique<ifstream>(); unique_ptr<ofstream> outFile_ = make_unique<ofstream>(); // 打开待编码二进制文件路径(此处以输入为PCM文件为例)。 inputFile_->open(inputFilePath.data(), ios::in|ios::binary); // 配置编码文件输出路径(此处以输出为编码码流文件为例)。 outFile_->open(outputFilePath.data(), ios::out|ios::binary); // 开始编码。 ret = OH_AudioCodec_Start(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 }
调用OH_AudioCodec_PushInputBuffer(),写入待编码器的数据。需开发者填充完整的输入数据后调用。
每帧样点数(SAMPLES_PER_FRAME)取值:
aac建议使用20ms的PCM样点数,即采样率*0.02。
flac比较特殊,需要根据如下表格进行设置。
|采样率|样点数| |:—-:|:—-:| | 8000| 576| |16000| 1152| |22050| 2304| |24000| 2304| |32000| 2304| |44100| 4608| |48000| 4608| |88200| 8192| |96000| 8192|
说明: aac编码的每帧样点数建议使用20ms的PCM样点数,即采样率*0.02。flac编码的样点数建议根据采样率按照表格传入,大于这个值也会返回错误码,如果小于有可能出现编码文件损坏问题。
c++
// 每帧样点数。
constexpr int32_t SAMPLES_PER_FRAME = DEFAULT_SAMPLERATE * TIME_PER_FRAME;
// 声道数,对于amr编码声道数只支持单声道的音频输入。
constexpr int32_t DEFAULT_CHANNEL_COUNT = 2;
// 每帧输入数据的长度,声道数 * 每帧样点数 * 每个样点的字节数(以采样格式SAMPLE_S16LE为例)。
// 如果最后一帧数据不满足长度,建议进行丢弃或填充处理。
constexpr int32_t INPUT_FRAME_BYTES = DEFAULT_CHANNEL_COUNT * SAMPLES_PER_FRAME * sizeof(short);
uint32_t index = signal_->inQueue_.front();
auto buffer = signal_->inBufferQueue_.front();
OH_AVCodecBufferAttr attr = {0};
if (!inputFile_->eof()) {
inputFile_->read((char *)OH_AVBuffer_GetAddr(buffer), INPUT_FRAME_BYTES);
attr.size = INPUT_FRAME_BYTES;
attr.flags = AVCODEC_BUFFER_FLAGS_NONE;
} else {
attr.size = 0;
attr.flags = AVCODEC_BUFFER_FLAGS_EOS;
}
OH_AVBuffer_SetBufferAttr(buffer, &attr);
// 送入编码输入队列进行编码, index为对应队列下标。
ret = OH_AudioCodec_PushInputBuffer(audioEnc_, index);
if (ret != AV_ERR_OK) {
// 异常处理。
}
在上方案例中,attr.flags代表缓冲区标记的类别。
如果是结束,需要将flags标识成AVCODEC_BUFFER_FLAGS_EOS。
|枚举值|描述| |——–|——–| |AVCODEC_BUFFER_FLAGS_NONE|表示为普通帧。| |AVCODEC_BUFFER_FLAGS_EOS|表示缓冲区是流结束帧。| |AVCODEC_BUFFER_FLAGS_CODEC_DATA|表示缓冲区包含编解码特定数据。|
- 调用OH_AudioCodec_FreeOutputBuffer(),释放编码后的数据。
在取走编码码流后,就应及时调用OH_AudioCodec_FreeOutputBuffer()进行释放。
```c++
uint32_t index = signal_->outQueue_.front();
OH_AVBuffer *avBuffer = signal_->outBufferQueue_.front();
// 获取buffer attributes。
OH_AVCodecBufferAttr attr = {0};
ret = OH_AVBuffer_GetBufferAttr(avBuffer, &attr);
if (ret != AV_ERR_OK) {
// 异常处理。
}
// 将编码完成数据data写入到对应输出文件中。
outputFile_->write(reinterpret_cast<char *>(OH_AVBuffer_GetAddr(avBuffer)), attr.size);
// 释放已完成写入的数据。
ret = OH_AudioCodec_FreeOutputBuffer(audioEnc_, index);
if (ret != AV_ERR_OK) {
// 异常处理。
}
if (attr.flags == AVCODEC_BUFFER_FLAGS_EOS) {
// 结束。
}
```
- (可选)调用OH_AudioCodec_Flush()刷新编码器。
调用OH_AudioCodec_Flush()后,编码器处于Flush状态,会将当前编码队列清空。
此时需要调用OH_AudioCodec_Start()重新开始编码。
使用情况:
在文件EOS之后,需要调用刷新。
在执行过程中遇到可继续执行的错误时(即OH_AudioCodec_IsValid 为true)可以调用,然后重新调用OH_AudioCodec_Start。
// 刷新编码器 audioEnc_。 ret = OH_AudioCodec_Flush(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 } // 重新开始编码。 ret = OH_AudioCodec_Start(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 }
(可选)调用OH_AudioCodec_Reset()重置编码器。
调用OH_AudioCodec_Reset()后,编码器回到初始化的状态,需要调用OH_AudioCodec_Configure()重新配置,然后调用OH_AudioCodec_Start()重新开始编码。
// 重置编码器 audioEnc_。 ret = OH_AudioCodec_Reset(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 } // 重新配置编码器参数。 ret = OH_AudioCodec_Configure(audioEnc_, format); if (ret != AV_ERR_OK) { // 异常处理。 }
调用OH_AudioCodec_Stop()停止编码器。
停止后,可以通过Start重新进入已启动状态(started),但需要注意的是,如果编码器之前已输入数据,则需要重新输入编码器数据。
// 终止编码器 audioEnc_。 ret = OH_AudioCodec_Stop(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 }
调用OH_AudioCodec_Destroy()销毁编码器实例,释放资源。
说明: 资源不能重复销毁
// 调用OH_AudioCodec_Destroy, 注销编码器。 ret = OH_AudioCodec_Destroy(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理。 } else { audioEnc_ = NULL; // 不可重复destroy。 }
相关实例
针对音频编码,有以下相关实例可供参考:
你可能感兴趣的鸿蒙文章
harmony 鸿蒙AVCodec Kit(音视频编解码服务)
- 所属分类: 后端技术
- 本文标签:
热门推荐
-
2、 - 优质文章
-
3、 gate.io
-
8、 golang
-
9、 openharmony
-
10、 Vue中input框自动聚焦