Pular para o conteúdo principal
Versões: 0.5.x

Módulo

Contém funções responsáveis pela validação de tipos de dados.

Módulo: aisp.utils.validation
Importação: from aisp.utils import validation

Funções

detect_vector_data_type

def detect_vector_data_type(vector: npt.NDArray) -> FeatureType:
...

Detecta o tipo de dado em um determinado vetor.

Esta função analisa o vetor de entrada e classifica seus dados como um dos tipos suportados:

  • binário: Valores booleanos (True/False) ou inteiro 0/1.
  • contínuo: Valores float dentro do intervalo normalizado [0.0, 1.0].
  • intervalo: Valores float fora do intervalo normalizado.

Parâmetros

NomeTipoPadrãoDescrição
vectornpt.NDArray-Um array contendo os dados a serem classificados.

Returns

TipoDescrição
FeatureTypeO tipo de dado detectado no vetor: "binary-features", "continuous-features", or " ranged-features".

Exceções

ExceçãoDescrição
UnsupportedTypeErrorSe o vetor contiver um tipo de dado não suportado.

check_array_type

def check_array_type(x, name: str = "X") -> npt.NDArray:
...

Garante que X seja um array numpy. Converte a partir de lista, se necessário.

Parâmetros

NomeTipoPadrãoDescrição
xAny-Array contendo as amostras e suas características. Formato: (n_samples, n_features).
namestr'X'Nome da variável usado em mensagens de erro.

Returns

TipoDescrição
npt.NDArrayO array convertido ou validado.

Exceções

ExceçãoDescrição
TypeErrorSe x não for ndarray nem lista.

check_shape_match

def check_shape_match(x: npt.NDArray, y: npt.NDArray):
...

Garante que X e y tenham dimensões compatíveis.

Parâmetros

NomeTipoPadrãoDescrição
xnpt.NDArray-Array contendo as amostras e suas características. Formato: (n_samples, n_features).
ynpt.NDArray-Array com as classes alvo de x, com formato (n_samples).

Exceções

ExceçãoDescrição
TypeErrorSe x ou y tiverem formatos incompatíveis.

check_feature_dimension

def check_feature_dimension(x: npt.NDArray, expected: int):
...

Garante que o array possui o número esperado de características (features).

Parâmetros

NomeTipoPadrãoDescrição
xnpt.NDArray-Array de entrada para predição, contendo as amostras e suas características. Formato:: (n_samples, n_features).
expectedint-Número esperado de features por amostra (colunas em X).

Exceções

ExceçãoDescrição
FeatureDimensionMismatchSe o número de features em X não corresponder ao esperado.

check_binary_array

def check_binary_array(x: npt.NDArray):
...

Garante que X contenha apenas valores (0 e 1) or (True e False).

Parâmetros

NomeTipoPadrãoDescrição
xnpt.NDArray-Array contendo as amostras.

Exceções

ExceçãoDescrição
ValueErrorSe o array contiver valores diferentes de 0 e 1.

check_value_range

def check_value_range(
x: npt.NDArray,
name: str = 'X',
min_value: float = 0.0,
max_value: float = 1.0
) -> None:
...

Garante que todos os valores do array x estejam dentro do intervalo.

Parâmetros

NomeTipoPadrãoDescrição
xnpt.NDArray-Array contendo as amostras.
namestr'X'Nome usado na mensagem de erro.
min_valuefloat0.0Valor mínimo permitido.
max_valuefloat1.0Valor máximo permitido.

Exceções

ExceçãoDescrição
ValueErrorSe o array estiver fora do intervalo (min_value, max_value).