suggestions

`lacuna.utils.suggestions` ¶

Fuzzy string matching utilities for improved error messages.

This module provides helpers for suggesting similar strings when users make typos or mistakes in key/attribute names. Used to enhance error messages with "Did you mean?" suggestions.

Examples:

>>> from lacuna.utils.suggestions import suggest_similar
>>> available = ["rmap", "zscoremap", "damagescore"]
>>> suggestions = suggest_similar("rmp", available, max_suggestions=2)
>>> suggestions
['rmap']

`format_suggestions(suggestions)` ¶

Format a list of suggestions for inclusion in an error message.

Parameters:

Name	Type	Description	Default
`suggestions`	`list[str]`	List of suggested strings.	required

Returns:

Type	Description
`str`	Formatted string for error message, or empty string if no suggestions.

Examples:

>>> format_suggestions(["rmap"])
"Did you mean 'rmap'?"

>>> format_suggestions(["rmap", "zscoremap"])
"Did you mean one of: 'rmap', 'zscoremap'?"

>>> format_suggestions([])
''

Source code in src/lacuna/utils/suggestions.py

def format_suggestions(suggestions: list[str]) -> str:
    """
    Format a list of suggestions for inclusion in an error message.

    Parameters
    ----------
    suggestions : list[str]
        List of suggested strings.

    Returns
    -------
    str
        Formatted string for error message, or empty string if no suggestions.

    Examples
    --------
    >>> format_suggestions(["rmap"])
    "Did you mean 'rmap'?"

    >>> format_suggestions(["rmap", "zscoremap"])
    "Did you mean one of: 'rmap', 'zscoremap'?"

    >>> format_suggestions([])
    ''
    """
    if not suggestions:
        return ""

    if len(suggestions) == 1:
        return f"Did you mean '{suggestions[0]}'?"

    quoted = [f"'{s}'" for s in suggestions]
    return f"Did you mean one of: {', '.join(quoted)}?"

`suggest_similar(query, candidates, max_suggestions=3, min_similarity=0.4)` ¶

Find candidates most similar to the query string.

Uses difflib.SequenceMatcher for similarity scoring. Results are sorted by similarity (most similar first) and filtered by minimum threshold.

Parameters:

Name	Type	Description	Default
`query`	`str`	The string to find matches for (e.g., user's typo).	required
`candidates`	`list[str]`	Available options to suggest from.	required
`max_suggestions`	`int`	Maximum number of suggestions to return.	`3`
`min_similarity`	`float`	Minimum similarity ratio (0.0 to 1.0) to include a suggestion. Higher values require closer matches.	`0.4`

Returns:

Type	Description
`list[str]`	Up to `max_suggestions` similar candidates, sorted by similarity. Empty list if no candidates meet the minimum similarity threshold.

Examples:

>>> available = ["rmap", "zscoremap", "damagescore"]
>>> suggest_similar("rmp", available)
['rmap']

>>> suggest_similar("score", available)
['zscoremap', 'damagescore']

>>> suggest_similar("xyz", available, min_similarity=0.5)
[]  # No close matches

>>> # Case-insensitive matching
>>> suggest_similar("Rmap", available)
['rmap']

Source code in src/lacuna/utils/suggestions.py

def suggest_similar(
    query: str,
    candidates: list[str],
    max_suggestions: int = 3,
    min_similarity: float = 0.4,
) -> list[str]:
    """
    Find candidates most similar to the query string.

    Uses difflib.SequenceMatcher for similarity scoring. Results are sorted
    by similarity (most similar first) and filtered by minimum threshold.

    Parameters
    ----------
    query : str
        The string to find matches for (e.g., user's typo).
    candidates : list[str]
        Available options to suggest from.
    max_suggestions : int, default=3
        Maximum number of suggestions to return.
    min_similarity : float, default=0.4
        Minimum similarity ratio (0.0 to 1.0) to include a suggestion.
        Higher values require closer matches.

    Returns
    -------
    list[str]
        Up to `max_suggestions` similar candidates, sorted by similarity.
        Empty list if no candidates meet the minimum similarity threshold.

    Examples
    --------
    >>> available = ["rmap", "zscoremap", "damagescore"]
    >>> suggest_similar("rmp", available)
    ['rmap']

    >>> suggest_similar("score", available)
    ['zscoremap', 'damagescore']

    >>> suggest_similar("xyz", available, min_similarity=0.5)
    []  # No close matches

    >>> # Case-insensitive matching
    >>> suggest_similar("Rmap", available)
    ['rmap']
    """
    if not candidates:
        return []

    # Compute similarity for each candidate
    query_lower = query.lower()
    scored = []

    for candidate in candidates:
        # Use case-insensitive comparison for scoring
        ratio = SequenceMatcher(None, query_lower, candidate.lower()).ratio()
        if ratio >= min_similarity:
            scored.append((ratio, candidate))

    # Sort by similarity (descending), then alphabetically for ties
    scored.sort(key=lambda x: (-x[0], x[1]))

    # Return top suggestions
    return [candidate for _, candidate in scored[:max_suggestions]]

suggestions

lacuna.utils.suggestions ¶

format_suggestions(suggestions) ¶

suggest_similar(query, candidates, max_suggestions=3, min_similarity=0.4) ¶

`lacuna.utils.suggestions` ¶

`format_suggestions(suggestions)` ¶

`suggest_similar(query, candidates, max_suggestions=3, min_similarity=0.4)` ¶