基因序列分类问题——多类分类器的设计

1. 问题背景 生物学研究中,用检测DNA序列来判断检测对象的物种愈来愈成为一种简便、快捷的手段。如今的测量技术已经可以很方便地测量出物种的DNA序列,将其进行分类能够运用机器学习的方法。本文将探讨如何基于DNA序列的数据集设计一个性能良好的多类的分类器。 2. 数据集简介 数据集中有共20000条基于序列,一共来自10个物种。其中一条基因是一个72个碱基的序列,以下所示: AGGGGGCTGGC
相关文章
相关标签/搜索