Ignore:
Timestamp:
Jun 23, 2014, 9:45:51 PM (11 years ago)
Author:
dmik
Message:

git: Merge version 2.0.0 from vendor to dmik branch.

Location:
git/branches/dmik
Files:
2 edited

Legend:

Unmodified
Added
Removed
  • git/branches/dmik

  • TabularUnified git/branches/dmik/diffcore-rename.c

    r347 r782  
    55#include "diff.h"
    66#include "diffcore.h"
    7 #include "hash.h"
     7#include "hashmap.h"
    88#include "progress.h"
    99
     
    3939                return NULL;
    4040        /* insert to make it at "first" */
    41         if (rename_dst_alloc <= rename_dst_nr) {
    42                 rename_dst_alloc = alloc_nr(rename_dst_alloc);
    43                 rename_dst = xrealloc(rename_dst,
    44                                       rename_dst_alloc * sizeof(*rename_dst));
    45         }
     41        ALLOC_GROW(rename_dst, rename_dst_nr + 1, rename_dst_alloc);
    4642        rename_dst_nr++;
    4743        if (first < rename_dst_nr)
     
    4945                        (rename_dst_nr - first - 1) * sizeof(*rename_dst));
    5046        rename_dst[first].two = alloc_filespec(two->path);
    51         fill_filespec(rename_dst[first].two, two->sha1, two->mode);
     47        fill_filespec(rename_dst[first].two, two->sha1, two->sha1_valid, two->mode);
    5248        rename_dst[first].pair = NULL;
    5349        return &(rename_dst[first]);
     
    8379
    8480        /* insert to make it at "first" */
    85         if (rename_src_alloc <= rename_src_nr) {
    86                 rename_src_alloc = alloc_nr(rename_src_alloc);
    87                 rename_src = xrealloc(rename_src,
    88                                       rename_src_alloc * sizeof(*rename_src));
    89         }
     81        ALLOC_GROW(rename_src, rename_src_nr + 1, rename_src_alloc);
    9082        rename_src_nr++;
    9183        if (first < rename_src_nr)
     
    244236
    245237struct file_similarity {
    246         int src_dst, index;
     238        struct hashmap_entry entry;
     239        int index;
    247240        struct diff_filespec *filespec;
    248         struct file_similarity *next;
    249241};
    250 
    251 static int find_identical_files(struct file_similarity *src,
    252                                 struct file_similarity *dst,
    253                                 struct diff_options *options)
    254 {
    255         int renames = 0;
    256 
    257         /*
    258          * Walk over all the destinations ...
    259          */
    260         do {
    261                 struct diff_filespec *target = dst->filespec;
    262                 struct file_similarity *p, *best;
    263                 int i = 100, best_score = -1;
    264 
    265                 /*
    266                  * .. to find the best source match
    267                  */
    268                 best = NULL;
    269                 for (p = src; p; p = p->next) {
    270                         int score;
    271                         struct diff_filespec *source = p->filespec;
    272 
    273                         /* False hash collision? */
    274                         if (hashcmp(source->sha1, target->sha1))
    275                                 continue;
    276                         /* Non-regular files? If so, the modes must match! */
    277                         if (!S_ISREG(source->mode) || !S_ISREG(target->mode)) {
    278                                 if (source->mode != target->mode)
    279                                         continue;
    280                         }
    281                         /* Give higher scores to sources that haven't been used already */
    282                         score = !source->rename_used;
    283                         if (source->rename_used && options->detect_rename != DIFF_DETECT_COPY)
    284                                 continue;
    285                         score += basename_same(source, target);
    286                         if (score > best_score) {
    287                                 best = p;
    288                                 best_score = score;
    289                                 if (score == 2)
    290                                         break;
    291                         }
    292 
    293                         /* Too many identical alternatives? Pick one */
    294                         if (!--i)
    295                                 break;
    296                 }
    297                 if (best) {
    298                         record_rename_pair(dst->index, best->index, MAX_SCORE);
    299                         renames++;
    300                 }
    301         } while ((dst = dst->next) != NULL);
    302         return renames;
    303 }
    304 
    305 static void free_similarity_list(struct file_similarity *p)
    306 {
    307         while (p) {
    308                 struct file_similarity *entry = p;
    309                 p = p->next;
    310                 free(entry);
    311         }
    312 }
    313 
    314 static int find_same_files(void *ptr, void *data)
    315 {
    316         int ret;
    317         struct file_similarity *p = ptr;
    318         struct file_similarity *src = NULL, *dst = NULL;
    319         struct diff_options *options = data;
    320 
    321         /* Split the hash list up into sources and destinations */
    322         do {
    323                 struct file_similarity *entry = p;
    324                 p = p->next;
    325                 if (entry->src_dst < 0) {
    326                         entry->next = src;
    327                         src = entry;
    328                 } else {
    329                         entry->next = dst;
    330                         dst = entry;
    331                 }
    332         } while (p);
    333 
    334         /*
    335          * If we have both sources *and* destinations, see if
    336          * we can match them up
    337          */
    338         ret = (src && dst) ? find_identical_files(src, dst, options) : 0;
    339 
    340         /* Free the hashes and return the number of renames found */
    341         free_similarity_list(src);
    342         free_similarity_list(dst);
    343         return ret;
    344 }
    345242
    346243static unsigned int hash_filespec(struct diff_filespec *filespec)
     
    356253}
    357254
    358 static void insert_file_table(struct hash_table *table, int src_dst, int index, struct diff_filespec *filespec)
    359 {
    360         void **pos;
    361         unsigned int hash;
     255static int find_identical_files(struct hashmap *srcs,
     256                                int dst_index,
     257                                struct diff_options *options)
     258{
     259        int renames = 0;
     260
     261        struct diff_filespec *target = rename_dst[dst_index].two;
     262        struct file_similarity *p, *best, dst;
     263        int i = 100, best_score = -1;
     264
     265        /*
     266         * Find the best source match for specified destination.
     267         */
     268        best = NULL;
     269        hashmap_entry_init(&dst, hash_filespec(target));
     270        for (p = hashmap_get(srcs, &dst, NULL); p; p = hashmap_get_next(srcs, p)) {
     271                int score;
     272                struct diff_filespec *source = p->filespec;
     273
     274                /* False hash collision? */
     275                if (hashcmp(source->sha1, target->sha1))
     276                        continue;
     277                /* Non-regular files? If so, the modes must match! */
     278                if (!S_ISREG(source->mode) || !S_ISREG(target->mode)) {
     279                        if (source->mode != target->mode)
     280                                continue;
     281                }
     282                /* Give higher scores to sources that haven't been used already */
     283                score = !source->rename_used;
     284                if (source->rename_used && options->detect_rename != DIFF_DETECT_COPY)
     285                        continue;
     286                score += basename_same(source, target);
     287                if (score > best_score) {
     288                        best = p;
     289                        best_score = score;
     290                        if (score == 2)
     291                                break;
     292                }
     293
     294                /* Too many identical alternatives? Pick one */
     295                if (!--i)
     296                        break;
     297        }
     298        if (best) {
     299                record_rename_pair(dst_index, best->index, MAX_SCORE);
     300                renames++;
     301        }
     302        return renames;
     303}
     304
     305static void insert_file_table(struct hashmap *table, int index, struct diff_filespec *filespec)
     306{
    362307        struct file_similarity *entry = xmalloc(sizeof(*entry));
    363308
    364         entry->src_dst = src_dst;
    365309        entry->index = index;
    366310        entry->filespec = filespec;
    367         entry->next = NULL;
    368 
    369         hash = hash_filespec(filespec);
    370         pos = insert_hash(hash, entry, table);
    371 
    372         /* We already had an entry there? */
    373         if (pos) {
    374                 entry->next = *pos;
    375                 *pos = entry;
    376         }
     311
     312        hashmap_entry_init(entry, hash_filespec(filespec));
     313        hashmap_add(table, entry);
    377314}
    378315
     
    386323static int find_exact_renames(struct diff_options *options)
    387324{
    388         int i;
    389         struct hash_table file_table;
    390 
    391         init_hash(&file_table);
     325        int i, renames = 0;
     326        struct hashmap file_table;
     327
     328        /* Add all sources to the hash table */
     329        hashmap_init(&file_table, NULL, rename_src_nr);
    392330        for (i = 0; i < rename_src_nr; i++)
    393                 insert_file_table(&file_table, -1, i, rename_src[i].p->one);
    394 
     331                insert_file_table(&file_table, i, rename_src[i].p->one);
     332
     333        /* Walk the destinations and find best source match */
    395334        for (i = 0; i < rename_dst_nr; i++)
    396                 insert_file_table(&file_table, 1, i, rename_dst[i].two);
    397 
    398         /* Find the renames */
    399         i = for_each_hash(&file_table, find_same_files, options);
    400 
    401         /* .. and free the hash data structure */
    402         free_hash(&file_table);
    403 
    404         return i;
     335                renames += find_identical_files(&file_table, i, options);
     336
     337        /* Free the hash data structure and entries */
     338        hashmap_free(&file_table, 1);
     339
     340        return renames;
    405341}
    406342
     
    513449                                 strcmp(options->single_follow, p->two->path))
    514450                                continue; /* not interested */
     451                        else if (!DIFF_OPT_TST(options, RENAME_EMPTY) &&
     452                                 is_empty_blob_sha1(p->two->sha1))
     453                                continue;
    515454                        else
    516455                                locate_rename_dst(p->two, 1);
    517456                }
     457                else if (!DIFF_OPT_TST(options, RENAME_EMPTY) &&
     458                         is_empty_blob_sha1(p->one->sha1))
     459                        continue;
    518460                else if (!DIFF_PAIR_UNMERGED(p) && !DIFF_FILE_VALID(p->two)) {
    519461                        /*
     
    573515        if (options->show_rename_progress) {
    574516                progress = start_progress_delay(
    575                                 "Performing inexact rename detection",
     517                                _("Performing inexact rename detection"),
    576518                                rename_dst_nr * rename_src_nr, 50, 1);
    577519        }
Note: See TracChangeset for help on using the changeset viewer.