”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > Tensorflow 音乐预测

Tensorflow 音乐预测

发布于2024-11-08
浏览:299

Tensorflow music prediction

在本文中,我将展示如何使用张量流来预测音乐风格。
在我的示例中,我比较了电子音乐和古典音乐。

您可以在我的github上找到代码:
https://github.com/victordalet/sound_to_partition


I - 数据集

第一步,您需要创建一个数据集文件夹,并在里面添加一个音乐风格文件夹,例如我添加一个 techno 文件夹和 classic 文件夹,其中放置我的 wav 歌曲。

II - 火车

我创建一个训练文件,参数 max_epochs 需要完成。

修改构造函数中与数据集文件夹中的目录对应的类。

在加载和处理方法中,我从不同的目录检索wav文件并获取频谱图。

出于训练目的,我使用 Keras 卷积和模型。

import os
import sys
from typing import List

import librosa
import numpy as np
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split
from tensorflow.keras.utils import to_categorical
from tensorflow.image import resize



class Train:

    def __init__(self):
        self.X_train = None
        self.X_test = None
        self.y_train = None
        self.y_test = None
        self.data_dir: str = 'dataset'
        self.classes: List[str] = ['techno','classic']
        self.max_epochs: int = int(sys.argv[1])

    @staticmethod
    def load_and_preprocess_data(data_dir, classes, target_shape=(128, 128)):
        data = []
        labels = []

        for i, class_name in enumerate(classes):
            class_dir = os.path.join(data_dir, class_name)
            for filename in os.listdir(class_dir):
                if filename.endswith('.wav'):
                    file_path = os.path.join(class_dir, filename)
                    audio_data, sample_rate = librosa.load(file_path, sr=None)
                    mel_spectrogram = librosa.feature.melspectrogram(y=audio_data, sr=sample_rate)
                    mel_spectrogram = resize(np.expand_dims(mel_spectrogram, axis=-1), target_shape)
                    data.append(mel_spectrogram)
                    labels.append(i)

        return np.array(data), np.array(labels)

    def create_model(self):
        data, labels = self.load_and_preprocess_data(self.data_dir, self.classes)
        labels = to_categorical(labels, num_classes=len(self.classes))  # Convert labels to one-hot encoding
        self.X_train, self.X_test, self.y_train, self.y_test = train_test_split(data, labels, test_size=0.2,
                                                                                random_state=42)

        input_shape = self.X_train[0].shape
        input_layer = Input(shape=input_shape)
        x = Conv2D(32, (3, 3), activation='relu')(input_layer)
        x = MaxPooling2D((2, 2))(x)
        x = Conv2D(64, (3, 3), activation='relu')(x)
        x = MaxPooling2D((2, 2))(x)
        x = Flatten()(x)
        x = Dense(64, activation='relu')(x)
        output_layer = Dense(len(self.classes), activation='softmax')(x)
        self.model = Model(input_layer, output_layer)

        self.model.compile(optimizer=Adam(learning_rate=0.001), loss='categorical_crossentropy', metrics=['accuracy'])

    def train_model(self):
        self.model.fit(self.X_train, self.y_train, epochs=self.max_epochs, batch_size=32,
                       validation_data=(self.X_test, self.y_test))
        test_accuracy = self.model.evaluate(self.X_test, self.y_test, verbose=0)
        print(test_accuracy[1])

    def save_model(self):
        self.model.save('weight.h5')


if __name__ == '__main__':
    train = Train()
    train.create_model()
    train.train_model()
    train.save_model()

III-测试

为了测试和使用该模型,我创建了此类来检索权重并预测音乐的风格。

不要忘记将正确的类添加到构造函数中。

from typing import List

import librosa
import numpy as np
from tensorflow.keras.models import load_model
from tensorflow.image import resize
import tensorflow as tf



class Test:

    def __init__(self, audio_file_path: str):
        self.model = load_model('weight.h5')
        self.target_shape = (128, 128)
        self.classes: List[str] = ['techno','classic']
        self.audio_file_path: str = audio_file_path

    def test_audio(self, file_path, model):
        audio_data, sample_rate = librosa.load(file_path, sr=None)
        mel_spectrogram = librosa.feature.melspectrogram(y=audio_data, sr=sample_rate)
        mel_spectrogram = resize(np.expand_dims(mel_spectrogram, axis=-1), self.target_shape)
        mel_spectrogram = tf.reshape(mel_spectrogram, (1,)   self.target_shape   (1,))

        predictions = model.predict(mel_spectrogram)

        class_probabilities = predictions[0]

        predicted_class_index = np.argmax(class_probabilities)

        return class_probabilities, predicted_class_index

    def test(self):
        class_probabilities, predicted_class_index = self.test_audio(self.audio_file_path, self.model)

        for i, class_label in enumerate(self.classes):
            probability = class_probabilities[i]
            print(f'Class: {class_label}, Probability: {probability:.4f}')

        predicted_class = self.classes[predicted_class_index]
        accuracy = class_probabilities[predicted_class_index]
        print(f'The audio is classified as: {predicted_class}')
        print(f'Accuracy: {accuracy:.4f}')
版本声明 本文转载于:https://dev.to/victordalet/tensorflow-music-prediction-4i6f?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 为什么我放弃 Python Flask 而选择 Django:Web 框架对决
    为什么我放弃 Python Flask 而选择 Django:Web 框架对决
    当您开始使用 Python Web 开发时,您可能会遇到 Django 和 Python Flask 作为两个最佳选择。这两个框架都有其优点,但根据我的经验,Django 通常是更好的选择。 我早期使用 Python Flask 的经历 当我第一次开始探索 Web 开发时,Pytho...
    编程 发布于2024-11-08
  • 掌握 Java 单元测试:&#Student Class Test&# 项目
    掌握 Java 单元测试:&#Student Class Test&# 项目
    通过 LabEx 的学生类测试项目深入单元测试的世界,释放您作为 Java 开发人员的潜力。这门综合课程将指导您完成为简单的 Student 类编写有效单元测试的过程,使您能够编写更可靠和可维护的代码。 介绍 在不断发展的软件开发领域,编写健壮且经过良好测试的代码的能力变得越来越重要...
    编程 发布于2024-11-08
  • 如何在 JavaScript 中模拟属性的 noSuchMethod 功能?
    如何在 JavaScript 中模拟属性的 noSuchMethod 功能?
    如何在 JavaScript 中实现 noSuchMethod 属性功能在 JavaScript 中,noSuchMethod虽然标准 JavaScript 语言中的属性没有直接等效项,但可以模拟类似的属性使用 ECMAScript 6 代理的功能。 ECMAScript 6 的发布引入了 Prox...
    编程 发布于2024-11-08
  • 为什么我的 GoLang 网络服务器无法提供大型 MP4 视频?
    为什么我的 GoLang 网络服务器无法提供大型 MP4 视频?
    GoLang HTTP Webserver Serving MP4 Video挑战使用 GoLang 创建了一个提供 HTML/JS/CSS 和图像的 Web 服务器。当服务器尝试提供 MP4 视频文件时,视频加载失败,仅显示视频控件。调查检查视频文件后,发现较小的视频可以正常工作,而较大的视频没有...
    编程 发布于2024-11-08
  • 如何在不使用 HTML 表单的情况下使用 PHP 重定向网页并发送 POST 数据?
    如何在不使用 HTML 表单的情况下使用 PHP 重定向网页并发送 POST 数据?
    使用 PHP 重定向和发送 POST 数据在这个问题中,我们遇到了一个独特的挑战:如何重定向网页并通过POST 方法不依赖于 HTML 表单。期望的结果是使用 PHP 脚本将隐藏字段提交到外部网关。通常,通过 GET 发送数据非常简单,如下面的代码片段所示:header('Location: htt...
    编程 发布于2024-11-08
  • 如何处理JSF表单提交过程中的授权失败?
    如何处理JSF表单提交过程中的授权失败?
    JSF 表单提交期间的授权失败:综合分析在 JSF 应用程序中实现自定义授权机制时,了解页面导航和表单提交之间的区别至关重要。虽然重定向可以无缝地进行页面导航,但它们在表单提交期间可能会遇到问题。问题原因此问题的根本原因在于 JSF 表单提交触发异步请求。当发送重定向作为对异步请求的响应时,JSF ...
    编程 发布于2024-11-08
  • 如何有效管理多个 JavaScript 和 CSS 文件以获得最佳页面性能?
    如何有效管理多个 JavaScript 和 CSS 文件以获得最佳页面性能?
    管理多个 JavaScript 和 CSS 文件:最佳实践组织过多的 JavaScript 和 CSS 文件可能会带来挑战,特别是在保持最佳页面性能方面。下面列出了有效解决此问题的最佳实践。PHP Minify:简化 HTTP 请求不要加载大量单独的文件,而是考虑使用 PHP Minify。该工具将...
    编程 发布于2024-11-08
  • 我的 Amazon SDE 面试经历 – 5 月 4 日
    我的 Amazon SDE 面试经历 – 5 月 4 日
    我的 Amazon SDE 面试经历 – 2024 年 5 月 2024 年 5 月,我有机会面试亚马逊的软件开发工程师 (SDE) 职位。这一切都始于一位招聘人员通过 LinkedIn 联系我。我很惊喜,因为它总是令人兴奋。 一切是如何开始的 招聘人员专业且清晰,...
    编程 发布于2024-11-08
  • 如何在 cURL POST 请求中发送多个图像?
    如何在 cURL POST 请求中发送多个图像?
    在 cURL POST 请求中使用数组在尝试使用 cURL 发送图像数组时,用户可能会遇到仅第一个图像的问题传输数组值。这个问题探讨了如何纠正这个问题。原始代码似乎在数组结构上有一个小缺陷。要解决此问题,建议使用 http_build_query 正确格式化数组:$fields = array( ...
    编程 发布于2024-11-08
  • 为什么 $_POST 中的 Axios POST 数据不可访问?
    为什么 $_POST 中的 Axios POST 数据不可访问?
    Axios Post 参数未由 $_POST 读取您正在使用 Axios 将数据发布到 PHP 端点,并希望在 $ 中访问它_POST 或 $_REQUEST。但是,您目前无法检测到它。最初,您使用了默认的 axios.post 方法,但由于怀疑标头问题而切换到提供的代码片段。尽管发生了这种变化,数...
    编程 发布于2024-11-08
  • ## JPQL 中的构造函数表达式:使用还是不使用?
    ## JPQL 中的构造函数表达式:使用还是不使用?
    JPQL 中的构造函数表达式:有益还是有问题的实践?JPQL 提供了使用构造函数表达式在 select 语句中创建新对象的能力。虽然此功能提供了某些优势,但它引发了关于其在软件开发实践中是否适用的问题。构造函数表达式的优点构造函数表达式允许开发人员从实体中提取特定数据并进行组装,从而简化了数据检索将...
    编程 发布于2024-11-08
  • 原型
    原型
    创意设计模式之一。 用于创建给定对象的重复/浅副本。 当直接创建对象成本高昂时,此模式很有用,例如:如果在查询大型数据库后创建对象,则一次又一次地创建该对象在性能方面并不经济。 因此,一旦创建了对象,我们就缓存该对象,并且在将来需要相同的对象时,我们从缓存中获取它,而不是从数据库中再次创建它,并在需...
    编程 发布于2024-11-08
  • Python 变量:命名规则和类型推断解释
    Python 变量:命名规则和类型推断解释
    Python 是一种广泛使用的编程语言,以其简单性和可读性而闻名。了解变量的工作原理是编写高效 Python 代码的基础。在本文中,我们将介绍Python变量命名规则和类型推断,确保您可以编写干净、无错误的代码。 Python变量命名规则 在Python中命名变量时,必须遵循一定的...
    编程 发布于2024-11-08
  • 如何同时高效地将多个列添加到 Pandas DataFrame 中?
    如何同时高效地将多个列添加到 Pandas DataFrame 中?
    同时向 Pandas DataFrame 添加多个列在 Pandas 数据操作中,有效地向 DataFrame 添加多个新列可能是一项需要优雅解决方案的任务。虽然使用带有等号的列列表语法的直观方法可能看起来很简单,但它可能会导致意外的结果。挑战如提供的示例中所示,以下语法无法按预期创建新列:df[[...
    编程 发布于2024-11-08
  • 从开发人员到高级架构师:技术专长和奉献精神的成功故事
    从开发人员到高级架构师:技术专长和奉献精神的成功故事
    一个开发人员晋升为高级架构师的真实故事 一位熟练的Java EE开发人员,只有4年的经验,加入了一家跨国IT公司,并晋升为高级架构师。凭借多样化的技能和 Oracle 认证的 Java EE 企业架构师,该开发人员已经证明了他在架构领域的勇气。 加入公司后,开发人员被分配到一个项目,该公司在为汽车制...
    编程 发布于2024-11-08

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3